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Analisis Diskriminan 


Analisis Diskriminan adalah teknik Multivariat yang termasuk pada 
Dependence Method, dengan ciri adanya variabel dependen dan independen. 
Dengan demikian, ada variabel yang hasilnya tergantung pada data variabel 
independen. Ciri khusus analisis diskriminan adalah data variabel dependen 
harus berupa data kategori, sedangkan data untuk variabel independen justru 
berupa data rasio. 


Secara teknis, analisis diskriminan mirip dengan analisis regresi, karena 
keduanya mempunyai variabel dependen dan variabel independen dalam 
modelnya. Hanya pada analisis regresi (sederhana maupun berganda), 
variabel dependen harus data rasio: sedangkan pada analisis diskriminan, 


jenis data untuk variabel dependen harus kategori. 


Karena mempunyai model yang sama, secara dasar kegunaan, analisis diskri- 
minan sama dengan analisis regresi. Dengan demikian, kegunaan utama dari 
analisis diskriminan ada dua. Pertama adalah kemampuan memprediksi 
terjadinya variabel dependen dengan masukan data variabel independen, 
kedua adalah kemampuan memilih mana variabel independen yang secara 
nyata memengaruhi variabel dependen dan mana yang tidak. Contoh 
sederhana berikut akan menjelaskan kegunaan analisis diskriminan dalam 
praktek. 


Misalkan PT JAYA ABADI yang selama ini menjual telepon seluler merk 
JAX ingin mengetahui bagaimana sikap responden terhadap ponsel tersebut: 
apakah memang ada kelompok responden yang suka dan ada kelompok 
responden yang tidak suka? Jika ada, faktor apa yang membedakan kedua 
kelompok responden tersebut: apakah model ponselnya, apakah kualitas 
ponselnya, apakah garansi produknya, ataukah karena perbedaan tingkat 
penghasilan responden? 


Pada kasus di atas, sikap “suka” dan “tidak suka?” pada ponsel JAX adalah 
variabel dependen, karena data itulah yang menjadi “kesimpulan” dari 
beberapa faktor (variabel independen). Jika digambarkan secara sederhana, 
akan menjadi: 
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SUKA/TIDAK SUKA PONSEL MERK JAX ».... MODEL PONSEL -.... 
KUALITAS PONSEL # ..... GARANSI PONSEL £..... TINGKAT 
PENGHASILAN RESPONDEN. 


Kemudian sejumlah responden disurvei dengan sebuah kuesioner yang 
meminta opini responden pada sikap mereka terhadap ponsel JAX, serta 
pendapat mereka atas empat faktor yang telah dikemukakan di atas. Setelah 
sekian data didapat, dilakukan pengolahan data menggunakan analisis 
diskriminan. Hasilnya sebuah model diskriminan, yang jika diinterpretasikan 
dalam contoh-contoh pernyataan adalah: 


e Apakah memang ada perbedaan yang jelas di antara sekian sikap res- 
ponden terhadap ponsel JAX, sehingga mereka yang suka dapat 
dibedakan dengan jelas dengan mereka yang tidak suka ponsel tersebut? 


e Jika memang ada perbedaan di antara kedua kelompok responden 
tersebut, faktor mana yang perbedaannya memang nyata dan faktor mana 
yang sesungguhnya tidak secara jelas berbeda? 


Misal faktor MODEL yang jelas membedakan (mendiskriminasi) sikap 
kedua kelompok responden tersebut. Misalkan pula skor rata-rata sikap 
responden kelompok 1 (SUKA) untuk model ponsel JAX adalah 4,5, 
sedangkan skor rata-rata sikap responden kelompok 2 (TIDAK SUKA) 
untuk model ponsel JAX adalah 1,5. Perbedaan keduanya (4,5 -1,5 — 3) 
signifikan, dan dapat disimpulkan model ponsel JAX-lah yang membuat 
ada perbedaan sikap di antara responden. Dengan kata lain, variabel 
independen model ponsel secara nyata membedakan isi variabel depen- 
den (konsumen yang suka atau tidak suka pada ponsel JAX). 


Kemudian hasil dari faktor GARANSI ternyata tidak jelas membedakan 
sikap kedua kelompok responden tersebut. Misal skor rata-rata sikap 
responden kelompok 1 (SUKA) untuk garansi yang dijanjikan ponsel 
JAX adalah 3,5 sedangkan skor rata-rata sikap responden kelompok 2 
(TIDAK SUKA) adalah 3,4. Perbedaan kedua angka sangat kecil (3,5- 
3,4—0,1), sehingga dapat disimpulkan garansi ponsel JAX tidak membuat 
perbedaan sikap di antara responden. 


Demikian seterusnya dapat dilihat dan disimpulkan faktor lain, yakni 
kualitas ponsel dan tingkat penghasilan konsumen. 


e Setelah model diskriminan didapat, analisis dilakukan. Langkah selan- 
jutnya yang tidak kalah penting adalah melihat sejauh mana ketepatan 
model diskriminan tersebut dapat memprediksi “isi” variabel dependen 
dengan input data dari variabel independen. 


Pada contoh di atas, misalkan ada responden bernama Ali yang mem- 
punyai skor sikap tertentu pada variabel independen model, kualitas, 
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garansi dan ia menyebutkan tingka penghasilan per bulannya. Pertanyaan 
yang muncul adalah secara skor total, Ali termasuk bersikap suka 
ataukah tidak suka terhadap ponsel merk JAX? Demikian seterusnya 
untuk responden Budi, Susi dan lainnya. Model diskriminan yang baik 
tentu dapat memprediksi secara tepat “posisi” seorang responden. Jika 
dari skornya ia seharusnya masuk ke kelompok SUKA, maka dalam 
prakteknya ia juga memang bersikap suka pada ponsel merk JAX, 
sebaliknya, jika ia seharusnya masuk ke kelompok TIDAK SUKA, maka 
dalam prakteknya ia seharusnya ada di kelompok tersebut. 


Tentu tidak ada model diskriminan yang menjamin ketepatan 100Yo, 
dalam artian bisa saja responden yang seharusnya masuk ke kelompok 
SUKA ternyata “meleset? ke kelompok TIDAK SUKA, dan sebaliknya. 
Namun demikian, tingkat ketepatan prediksi model tersebut haruslah 
tinggi, misalkan di atas 70Yo, sehingga model tersebut dapat digunakan 
oleh manajer PT JAYA ABADI untuk merencanakan sejumlah strategi 
promosi tertentu bagi kelompok konsumen yang suka, agar mereka tetap 
loyal, dan strategi promosi yang lain kepada kelompok konsumen yang 
tidak suka, agar mereka dapat beralih menjadi menyukai ponsel JAX. 
Atau dapat dilakukan rencana-rencana lain berdasar hasil model diskri- 
minan tersebut. 


Selain dalam bidang pemasaran, analisis diskriminan juga populer dalam 
bidang manajemen keuangan, khususnya pengembangan model untuk 
memprediksi kesehatan keuangan perusahaan dengan variabel independen 
sejumlah rasio keuangan tertentu, dan variabel dependen adalah SEHAT atau 
TIDAK SEHAT. Pembuatan model diskriminan yang mempunyai kemam- 
puan prediksi tinggi tentu sangat bermanfaat untuk membantu pengambilan 
keputusan yang tepat. 


Berikut akan dijelaskan hal-hal umum yang perlu diketahui tentang analisis 
diskriminan dan beberapa contoh kasus penerapannya. 


Hal-Hal Pokok Tentang Analisis 
Diskriminan 


Tujuan Analisis Diskriminan 


Karena bentuk multivariat dari Analisis Diskriminan adalah Dependence, 
maka variabel Dependen adalah variabel yang menjadi dasar analisis 
diskriminan. Variabel Dependen bisa berupa kode grup 1 atau grup 2 atau 
lainnya, dengan tujuan diskriminan secara umum adalah: 
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e Ingin mengetahui apakah ada perbedaan yang jelas antar-grup pada 
variabel dependen? Atau bisa dikatakan apakah ada perbedaan antara 
anggota Grup 1 dengan anggota Grup 2? 


e Jika ada perbedaan, variabel independen manakah pada fungsi diskri- 
minan yang membuat perbedaan tersebut? 


e Membuat Fungsi atau Model Diskriminan, yang pada dasarnya mirip 
dengan persamaan regresi. 


e Melakukan klasifikasi terhadap objek (dalam terminologi SPSS disebut 
baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda 
atau lainnya) termasuk pada grup 1 atau grup 2, atau lainnya. 


Proses Dasar dari Discriminant Analysis 
Proses dasar dari analisis diskriminan: 


e«  Memisah variabel-variabel menjadi Variabel Dependen dan Variabel 
Independen. 


e Menentukan metode untuk membuat Fungsi Diskriminan. Pada prin- 
sipnya ada dua metode dasar untuk itu, yakni: 


1. SIMULTANEOUS ESTIMATION, di mana semua variabel dima- 
sukkan secara bersama-sama kemudian dilakukan proses Diskri- 
minan. 


2. STEP-WISE ESTIMATION, di mana variabel dimasukkan satu per 
satu ke dalam model diskriminan. Pada proses ini, tentu ada variabel 
yang tetap ada pada model, dan ada kemungkinan satu atau lebih 
variabel independen yang 'dibuang' dari model. 


e Menguji signifikansi dari Fungsi Diskriminan yang telah terbentuk, 
menggunakan Wilk's Lambda, Pilai, F test dan lainnya. 


e« Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk menge- 
tahui ketepatan klasifikasi secara individual dengan Casewise Diag- 
nostics. 


e Melakukan interpretasi terhadap Fungsi Diskriminan tersebut. 


e Melakukan uji validasi Fungsi Diskriminan. 


Jumlah Sampel pada Analisis Diskriminan 


Secara pasti tidak ada jumlah sampel yang ideal pada Analisis Diskriminan. 
Pedoman yang bersifat umum menyatakan untuk setiap variabel independen 
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sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel 
independen, seharusnya minimal ada 6x5—30 sampel. Secara terminologi 
SPSS, jika ada enam kolom variabel independen, sebaiknya ada 30 baris data. 


Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, 
yakni analysis sample yang digunakan untuk membuat Fungsi Diskriminan, 
serta holdout sample (spilt sample) yang digunakan untuk menguji hasil 
diskriminan. Sebagai contoh, jika ada 70 sampel, maka sampel tersebut bisa 
dibagi dua, 35 untuk analysis sample dan 35 untuk holdout sample. 
Kemudian hasil fungsi diskriminan yang terjadi pada analysis sample 
dibandingkan dengan hasil fungsi diskriminan dari holdput sample, apakah 
terjadi perbedaan yang besar ataukah tidak. Jika ketepatan klasifikasi kedua 
sampel hampir sama besar, dikatakan fungis diskriminan dari analysis sample 
sudah valid. Inilah yang disebut proses validasi silang (Cross Validation) dari 
fungsi diskriminan. 


Asumsi pada Analisis Diskriminan 


Asumsi penting yang harus dipenuhi agar model diskriminan bisa digunakan 
adalah: 


e Multivariate Normality, atau variabel independen seharusnya berdis- 
tribusi normal. Jika data tidak berdistribusi normal, hal ini akan 
menyebabkan masalah pada ketepatan fungsi (model) diskriminan. 
Regresi Logistik (Logistic Regression) bisa dijadikan alternatif metode 
Jika memang data tidak berdistribusi normal. 


e Matriks kovarians dari semua variabel independen seharusnya sama 
(egual). 


e Tidak ada korelasi antar-variabel independen. Jika dua variabel inde- 
penden mempunyai korelasi yang kuat, dikatakan terjadi multikolinie- 
ritas. 


e Tidak adanya data yang sangat ekstrem (outlier) pada variabel inde- 
penden. Jika ada data outlier yang tetap diproses, hal ini bisa berakibat 
berkurangnya ketepatan klasifikasi dari fungsi diskriminan. 


Model dari Analisis Diskriminan 


Analisis diskriminan termasuk dalam Multivariate Dependence Method, 
dengan model: 


Y, — XitXt..HX 
Non-Metrik Metrik 
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Keterangan: 


e Variabel Independen (Xj dan seterusnya) adalah data metrik, yakni data 
berjenis interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, 
kandungan zat besi dalam tubuh, dan sebagainya. 


e Variabel Dependen (Y,) adalah Data Kategorikal atau Nominal, seperti 
Golongan Miskin (kode 1), Golongan Menengah (kode 2), Golongan 
Kaya (kode 3) dan sebagainya. Jika data kategorikal tersebut hanya 
terdiri atas dua kode saja (misal kode 1 untuk Daerah Banjir dan kode 2 
Daerah Non-Banjir), maka model bisa disebut Two-Group Discriminant 
Analysis. Sedang jika kode lebih dari dua kategori, disebut dengan 
Multiple Discriminant Analysis. 


e Dari keterangan di atas, perhatikan adanya perbedaan dalam penempatan 
data yang sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia 
disebut secara langsung sekian tahun (17 tahun, 32 tahun dan seba- 
gainya), maka data tersebut adalah rasio dan otomatis diperlakukan 
sebagai variabel independen. Namun, jika Usia seseorang dilakukan 
penggolongan, dan dimasukkan dalam kategori-kategori tertentu, seperti 
jika Usia seseorang antara 15-20 tahun, ia digolongkan Remaja, di atas 
20 tahun digolongkan Dewasa, maka data orang yang berusia 17 tahun 
tidak akan ditulis langsung '17', namun akan ditulis Remaja. Data hasil 
kategorisasi ini adalah data nominal dan termasuk variabel Dependen. 


Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau 
independen tergantung bagaimana data tersebut akan diperlakukan, 
langsung diinput apa adanya atau dilakukan penggolongan. 


Berikut dibahas dua kasus, yakni analisis diskriminan untuk dua faktor dan 
tiga faktor. 


3.2 Analisis Diskriminan Dua Faktor 


5.21 Uji Variabel 


Dengan Analisis Diskriminan, pada akhirnya akan dibuat sebuah model 
seperti regresi, yakni adanya SEBUAH variabel dependen, dan SATU ATAU 
LEBIH variabel independen. Perbedaan analisis diskriminan dengan model 
regresi adalah pada jenis data yang digunakan, pada analisis diskriminan, 
variabel dependen selalu data kategori. 


Prinsip Diskriminan adalah ingin membuat model yang bisa secara jelas 
menunjukkan perbedaan (diskriminasi) antar isi variabel dependen, yang 
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dalam kasus berikut adalah perilaku Sedikit minum atau Banyak minum air 
mineral. Untuk itu, langkah pertama pada Analisis Diskriminan adalah 
menguji apakah semua variabel independent (bebas) berbeda secara nyata 
berdasar variabel dependen. Terkait dengan kasus di bawah, sebagai contoh 
akan diuji apakah variabel USIA konsumen berbeda pada mereka yang 
banyak minum dengan mereka yang sedikit minum. 


KASUS 


Sebuah Perusahaan yang bergerak dalam penjualan Air Mineral mengum- 
pulkan data sekelompok konsumen Air Mineral dengan variabel berikut. 


e Tipe Konsumen dari banyaknya Air Mineral yang diminum, dengan 
kode: 


Kode 0 - SEDIKIT (konsumen yang termasuk tipe sedikit minum air 
mineral) 


Kode 1 —- BANYAK (konsumen yang termasuk tipe banyak minum air 
mineral) 


e Usia Konsumen (tahun) 

e Berat Badan Konsumen (kilogram) 

e Tinggi Badan Konsumen (centimeter) 

e Pendapatan Konsumen (ribuan rupiah/bulan) 
e Jam Kerja Konsumen dalam sehari (jam) 


e Kegiatan Olahraga Konsumen dalam sehari (jam) 


Variabel NAMA tidak disertakan dalam proses analisis diskriminan, karena 
berupa data STRING (berisi karakter dan bukannya angka). 


Berikut sebagian tampilan data dengan SPSS. 


nama minum usia berat tinggi income jamkerja olahraga 
1 RUSDI 0.00 40.00 65.00 154.00 680.00 5.33 3.0 
2 | NINA 0.00 30.00 70.00 157.00 700.00 5.30 3. 
5 | LANNY 0.00 25.00 60.00 158.00 580.00 5.27 3.3 
4 CITRA O.00 26.00 75.00 160.00 600.00 5.33 3.0 
5 | DINA 0.00 40.00 50.00 159.00 700.00 5.50 39 
| 6 SISKA 1.00 28.00 62.00 158.00 440.00 5.00 2.2 
7 LUSI 0.00 29.00 50.00 160.00 580.00 5.07 2.9 
8 | LENNY O.O0 40.00 52.00 165.00 800.00 5.13 4g 


Gambar 5.1. Tampilan Data Kasus 
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Contoh Interpretasi Data 


Pada baris pertama, konsumen dengan nama Rusdi ternyata termasuk orang 
yang sedikit minum air mineral. Ia berusia 40 tahun, berat badan 65 kilogram 
dengan tinggi 154 centimeter, penghasilan per bulan Rp.680.000,-, dalam 
sehari ia bekerja rata-rata 5,33 jam serta melakukan aktivitas berolahraga 
rata-rata 3 jam dalam sehari. 


Demikian seterusnya untuk konsumen-konsumen yang lain. 


Dari file DISKRIMINAN yang berisi Profil Pembeli Air Mineral Dalam 
Kemasan (AMDK) dari segala macam merk tersebut, akan dilakukan analisis 
Diskriminan untuk mengetahui: 


e Apakah ada perbedaan yang signifikan antara Mereka yang banyak 
minum AMDK dengan mereka yang sedikit meminumnya? 


e Jika ada perbedaan yang signifikan, variabel apa saja yang membuat 
perilaku konsumsi air mineral mereka berbeda? 


e Membuat model diskriminan dua faktor (karena hanya ada mereka yang 
SEDIKIT dengan yang BANYAK) untuk kasus tersebut. 


e Menguji ketepatan model (fungsi) diskriminan. 


Langkah 

Tahapan pengujian pada analisis Diskriminan. 

1. MENILAI VARIABEL YANG LAYAK UNTUK ANALISIS 
e Buka file diskriminan. 


e Menu Analyze 5 Classify D Discriminant.... Tampak di layar: 


4 
Discriminant Analysis (Se 


ing Wariable: p 
: » Grouping Variable: Statistics... 
£ minum — 
# usia 
$ verat Classity... | 
& tingsi Independents: 
#2? Save... | 

income 2 5 
P4 jamkerja 
# olahraga 


ke) 


3) Enter independents together 


Use stepwise method 
("“ Selection Variable: 


| Reset II Cancel II Help | 


Gambar 5.2. Kotak Dialog Discriminant Analysis 
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Pengisian: 


Masukkan variabel minum ke bagian GROUPING VARIABLE. 
Hal ini berarti variabel MINUM berfungsi sebagai dependent 
variable (variabel tergantung), yang berciri data kategori. Karena itu, 
SPSS meminta masukan kode kategori yang dipakai. 


Untuk itu, buka ikon DEFINE RANGE..., hingga tampak di layar: 


BEJ Discriminant Analysis: Define Range 


Minimum: 


Maximum: 


Cancel || Help Jj 


Sesuai kode untuk variabel MINUM, maka: 
o Masukkan angka 0 pada Minimum 
o Masukkan angka 1 pada Maximum 


Tekan tombol CONTINUE untuk kembali ke kotak dialog utama. 


Kode variabel MINUM dapat dilihat dengan menekan CTRL-T, lihat 
bagian (kolom) VALUES untuk variabel tersebut. 


Masukkan variabel usia, berat, tinggi, income, jamkerja dan 
olahraga ke dalam kotak INDEPENDENT. Hal ini berarti keenam 
variabel tersebut berfungsi sebagai variabel bebas (independen). 


Klik ikon STATISTICS. Tampak di layar: 


5 
| Discriminant Analysis: Statistics 3 
Descriptives Matrices 
C ) Mean) (“Jwithin-groups correlation 


(“JUnivariate ANOVAS Within-groups coyariance 


(Box M (Cl Separate-groups covariance 


1 (C1 Total covariance 
Function Coefficients. 2 


(JEishers 
(Unstandardized 


| Continue | Cancel JI Help 


Gambar 5.3. Kotak Dialog Statistics 


Pengisian: 


Pada bagian DESCRIPTIVES, aktifkan pilihan Univariate 
ANOVASs dan Box's M. 
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Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak 
dialog utama. 


Abaikan bagian lain dan tekan OK untuk proses uji variabel, dengan Output: 
(disimpan pada file DISKRIMINAN UJI VARIABEL.spv) 


PERHATIKAN TIDAK SEMUA BAGIAN OUTPUT DITAMPILKAN. 
HANYA DUA BAGIAN OUTPUT YANG RELEVAN YANG AKAN 
DIBAHAS. 


tinggi 
income 


jamkerja 
olahraga 


Wilks' 
Lambda 
usia : 
berat 


Tests of Eguality of Group Means 


Analisis 


Tabel di atas adalah hasil pengujian untuk setiap variabel bebas yang ada. 


Keputusan bisa diambil lewat dua cara. 
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Dengan angka Wilk's Lambda 


Angka Wilk's Lambda berkisar 0 sampai 1. Jika angka mendekati 0 
maka data tiap grup cenderung berbeda, sedang jika angka mendekati 1, 
data tiap grup cenderung sama. 


Dari tabel terlihat angka Wilk's Lambda berkisar antara 0,894 sampai 
0,999 (mendekati 1). Dari kolom Sig bisa dilihat bahwa hanya variabel 
JAM KERJA yang cenderung tidak berbeda. Hal ini berarti Jam kerja 
untuk mereka yang sedikit atau banyak mengonsumsi air mineral 
ternyata tidak berbeda secara nyata. Hanya di sini kriteria "mendekati 
angka 1' adalah sulit ditentukan secara pasti, karena hampir semua 
variabel di atas mempunyai angka Wilk's Lambda yang besar, namun 
hanya satu variabel yang tidak lolos. Untuk itu, pengujian dengan 
ANOVA, yang dibahas di bawah ini, lebih mudah dilakukan. 


Dengan F test 

Lihat angka Sig. 

Jika Sig. » 0,05 berarti tidak ada perbedaan antar-grup. 
Jika Sig. « 0,05 berarti ada perbedaan antar-grup. 


Contoh analisis menggunakan uji F: 


— Variabel USIA, angka Sig. adalah di bawah 0,05 (0,043). Hal ini 
berarti ada perbedaan antar-grup, atau responden yang banyak 
membeli atau sedikit mengonsumsi air mineral terkait dengan usia 
responden tersebut. Mungkin mereka yang lebih tua akan lebih 
banyak mengonsumsi dibanding mereka yang masih muda usia, atau 
mungkin sebaliknya. Hal ini akan dibahas saat sudah terbentuk 
model diskriminan. 


— Variabel BERAT, angka Sig. adalah di bawah 0,05 (0,026). Hal ini 
berarti berat badan responden memengaruhi banyak sedikitnya 
mereka mengonsunssi air mineral. 


— Variabel JAM KERJA, angka Sig. adalah jauh di atas 0,05 (0,783). 
Hal ini berarti jumlah Jam Kerja seorang responden tidak memenga- 
ruhi banyak sedikitnya konsumsi air mineral mereka. Kesimpulan ini 
sama dengan jika berpatokan pada angka Wilk's Lambda yang 
hampir mendekati 1 untuk variabel JAM KERJA. 


Dari enam variabel, ada lima variabel yang berbeda secara signifikan untuk 
dua grup diskriminan, yaitu USIA, BERAT, TINGGI, INCOME dan 
OLAHRAGA. Dengan demikian, sedikit atau banyaknya konsumsi seseorang 
akan air mineral dipengaruhi oleh usia responden tersebut, berat dan tinggi 
badan responden, tingkat penghasilan seorang responden, dan kegiatan 
olahraga responden yang bersangkutan. 


Catatan 


Pada beberapa analisis diskriminan, sebuah variabel yang tidak lolos uji tidak 
otomatis dikeluarkan. Seperti pada kasus di atas, variabel JAM KERJA 
walaupun tidak lolos uji, namun seharusnya tetap disertakan pada analisis 
diskriminan selanjutnya. Pandangan ini berdasar pada prinsip bahwa pada 
analisis multivariat, variabel-variabel dianggap suatu kesatuan, dan bukannya 
terpisah-pisah. 


Test Results 


Box's M 28145 
F Approx. 1.222 
dri 21 


df2 19569.371 
.220 


Tests null hypothesis of 
egual population 
covariance matrices. 
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Analisis 


Jika analisis ANOVA dan angka Wilk's Lambda menguji means (rata-rata) 
dari setiap variabel, maka Box's M menguji varians dari setiap variabel. 
Analisis Diskriminan mempunyai asumsi bahwa: 


Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian, 
seharusnya varians dari Responden yang Sedikit mengonsumsi air 
mineral sama dengan varians dari Responden yang Banyak mengon- 
sumnsi air mineral. 


Varians di antara variabel-variabel bebas seharusnya juga sama. Jika 
demikian, seharusnya varians dari USIA sama dengan varians dari 
BERAT, sama dengan variabel OLAHRAGA dan sebagainya. 


Kedua pengertian di atas bisa disimpulkan, seharusnya group covariance 
matrices adalah relatif sama, yang diuji dengan alat Box's M dengan 
ketentuan: 


HIPOTESIS 

Ho: group covariance matrices adalah relatif sama 

Hi: group covariance matrices adalah berbeda secara nyata 
Keputusan dengan dasar signifikansi (lihat angka Sig.) 

Jika Sig. 5 0,05 berarti Ho diterima. 

Jika Sig. « 0,05 berarti Ho ditolak. 


Dari tabel terlihat bahwa angka Sig. jauh di atas 0,05 (0,220) yang berarti 
group covariance matrices adalah sama. Hal ini berarti data di atas sudah 
memenuhi asumsi analisis diskriminan, sehingga proses bisa dilanjutkan. 


Catatan 


Sama tidaknya group covariance matrices juga bisa dilihat dari tabel 
output LOG DETERMINANT berikut (ada di atas tabel Box's M). 


Ba ben Besa! 
minum Rank Determinant 


Log Determinants 


sedikit 


banyak 
Pooled within-groups 


The ranks and natural logarithms of 
determinants printed are those of the group 
coyariance matrices. 
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Terlihat angka Log Determinant untuk kategori SEDIKIT (14,085) dan 
BANYAK (14,258) tidak berbeda banyak, sehingga group covariance 
matrices akan relatif sama untuk kedua group. 


e Bagaimana jika ternyata group covariance matrices adalah berbeda 
secara nyata? 


Jika hal ini terjadi pada variabel dependen yang hanya ada dua 
kemungkinan, seperti pada kasus di atas (hanya ada kategori SEDIKIT 
dan BANYAK), maka proses lanjutan seharusnya tidak bisa dilakukan. 


Namun, jika hal itu terjadi pada kasus dengan variabel dependen dengan 
kategori banyak (misal ada 5 kategori: SANGAT SEDIKIT, SEDIKIT, 
CUKUP BANYAK, BANYAK, SANGAT BANYAK), maka dengan 
melihat angka LOG DETERMINANT (lihat penjelasan terdahulu), di 
mana angka yang paling berbeda (misal tanda - sedang yang lain t) bisa 
dibuang dan proses uji diulang lagi. Jadi, -sebagai contoh- variabel 
CUKUP BANYAK- mungkin dikeluarkan dan proses diulang lagi. 
Dengan demikian, bisa saja nanti tinggal tiga kategori, namun asumsi 
sudah terpenuhi. 


5.2.2 Melakukan Analisis Diskriminan 


Setelah dilakukan pengujian atas variabel yang akan diproses (lihat kasus 
sebelumnya), langkah selanjutnya adalah melakukan proses pembuatan 
model diskriminan. Pada kasus ini akan dibahas model diskriminan yang 
paling sederhana, yakni hanya melibatkan dua kategori pada variabel 
dependen (Two-Group). 


KASUS (lanjutan) 


Dari uji variabel file DISKRIMINAN yang berisi Profil Pembeli Air Mineral 
Dalam Kemasan (AMDK) pada kasus sebelumnya, diketahui ada lima 
variabel yang lolos uji, yakni USIA, BERAT, TINGGI, INCOME dan 
OLAHRAGA. Langkah selanjutnya adalah membuat model diskriminan dua 
faktor untuk kasus tersebut. 


Langkah 
Tahapan lanjutan pada Analisis Diskriminan. 
2. PROSES DISKRIMINAN 


Karena hanya ada dua kategori pada variabel dependent (MINUM), maka 
yang akan dibuat adalah model satu faktor. 
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e Buka file diskriminan. 


e Menu Analyze 5 Classify 5 Discriminant.... Tampak di layar: 


FB Discriminant Analysis Sen 
Grouping Variable: 
tistics 
Cam »J 7 Lesvusenn 
P usia 
£ pera Classity. 
£ tnaci Independents: 5 
income Ave. 
£ iamkerja » | 
olahraga —— 
5) Enter independents together 
9 Use stepwise method 
(— Selection Variable: 
»)j | 
(Reset JI cancer JO nep | 


Gambar 5.4. Kotak Dialog Discriminant Analysis 


Pengisian (mirip dengan pengisian pada kasus sebelumnya): 
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Masukkan variabel minum ke bagian GROUPING VARIABLE. 


Kemudian buka ikon DEFINE RANGE. Pada kotak dialog, sesuai 
kode untuk variabel MINUM: 


o Masukkan angka 0 pada Minimum. 
o Masukkan angka 1 pada Maximum. 
Tekan tombol CONTINUE untuk kembali ke kotak dialog utama. 


Masukkan variabel usia, berat, tinggi, income dan olahraga ke 
dalam kotak INDEPENDENT. 


Klik ikon STATISTICS. Tampak di layar: 


z3) Discriminant Analysis: Statistics (mem 
Descriptives Matrices 
Means) Wwithin-aroups correlation 
(“JUnivariate ANOVAS (| within-groups coyariance 
CJ Boxs m Separate-groups covariance 
Total covariance 


Function Coefficients 


| JFisher's 


(JUnstandardized 


(continue || cancer || Het 


Gambar 5.5. Kotak Dialog Statistics 


Pengisian: 


o Pada bagian DESCRIPTIVES, aktifkan pilihan Means. 


o Pada bagian FUNCTION COEFFICIENTS, aktifkan pilihan 
Fisher's dan Unstandardized. 


Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak 
dialog utama. 


e Perhatikan bagian tengah kotak dialog utama DISCRIMINANT. Klik 
mouse pada pilihan Use stepwise method (yang terletak di tengah 
bawah), maka secara otomatis ikon METHOD yang ada di bagian kanan 
kotak dialog utama akan terbuka (aktif). 


Klik ikon METHOD tersebut. Tampak di layar: 


3) Discriminant Analysis: Stepwise Method c 
Method Criteria 
@ fasik" lambda (G) Use F value 


Entry: |3.84 Removal: 2.71 


O Unexplained variance 


() Mahalanobis distance 
O Smallest F ratio () Use probability of F 


(O Raos V 


Display 


(#1 Summary of steps (CJF for pairwise distances 


| Continue — cancel || Help J 


Gambar 5.6. Kotak Dialog Stepwise Method 


Memilih STEP WISE Method berarti variabel akan dimasukkan satu per 
satu ke dalam model, dan bukannya sekaligus seperti jika pilihan adalah 
ENTER INDEPENDENT TOGETHER. 


Pengisian: 
— Pada bagian METHOD, pilih Mahalanobis distance. 
NB: metode untuk diskriminan menggunakan metode Mahalanobis. 


— Pada bagian CRITERIA, pilih Use Probability of F, namun jangan 
mengubah isi yang sudah ada (default). 


Di sini lolos tidaknya sebuah variabel akan diuji dengan uji F, dengan 


batasan signifikansi 540 (0,05). 


Abaikan bagian yang lain, kemudian tekan CONTINUE untuk kembali 
ke kotak dialog utama. 


e Klik ikon CLASSIFY. Tampak di layar: 


13 Discriminant Analysis: Classification Sc) 


Prior Probabilities Use Covariance Matrix 
(@ Jail groups egual (@ within-groups 

(0 Compute from group sizes (D Separate-groups 
Display Plots 


Casewise results Combined-groups 


(“separate-groups 


Summary table || Territorial map 


Leave-one-out classification 


| Replace missing values with mean 


| Continue JI Cancel II Help | 


Gambar 5.7. Kotak Dialog Classification 


Kotak dialog CLASSIFY adalah pelengkap dari pembuatan model 
diskriminan, terutama cara penyajian model diskriminan, serta kelayakan 
model tersebut. 


Pengisian: 


— Pada bagian DISPLAY, aktifkan pilihan Casewise results. 


Pilihan ini untuk membandingkan hasil kasus awal dengan model diskri- 


minan. 


— Masih pada bagian DISPLAY, aktifkan juga pilihan Leave-one-out- 
classification. 


Pilihan ini untuk menampilkan data yang cocok dengan hasil proses 


diskriminan, dan mana yang tidak cocok (misclassified). 


Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak 
dialog utama. 


Abaikan ikon yang lain, dan tekan OK untuk proses data. 


3. ANALISIS OUTPUT DISKRIMINAN 
Output (simpan dengan nama diskriminan 2 faktor). 


OUTPUT AKAN DITAMPILKAN PER BAGIAN UNTUK ANALISIS, 
DENGAN CATATAN TIDAK SEMUA OUTPUT DITAMPILKAN. 
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Group Statistics 


minum Std. Deviation | Unweighted | Weighted 
38 


sedikit usia 31.8684 612558 
berat 57.2105 11.76609 
tinggi 1584474 5.66496 
income 659.4737 106.79476 
olahraga 31974 55385 
banyak usia 289459 515515 
berat 51.8108 8.40475 
tinggi 161.5676 744439 
income 578.9189 129.52442 
olahraga 2.9054 .6rrso 
usia 30.4267 6.27344 
berat 54.5467 10.56549 
tinggi 159.9867 6.74335 
income 619.7333 12453127 
olahraga 3.0533 63124 


Tabel GROUP STATISTICS pada dasarnya berisi data statistik (deskriptif) 
yang utama, yakni Rata-rata dan standar deviasi, dari kedua grup Konsumen. 


Sebagai contoh, Konsumen yang termasuk tipe SEDIKIT meminum air 
mineral, mempunyai Berat badan rata-rata 57,21 kilogram. Sedangkan 
mereka yang termasuk tipe BANYAK meminum air mineral, mempunyai 
Berat badan rata-rata lebih rendah, yakni 51,81 kilogram. Kedua angka ini 
tentu berbeda, namun apakah perbedaan tersebut nyata (signifikan)? 


Demikian pula untuk variabel lainnya, semua mempunyai angka rata-rata dan 
standar deviasi yang berbeda untuk kedua Grup Konsumen. Dan semuanya 
akan diuji untuk mengetahui variabel mana yang mempunyai perbedaan yang 
signifikan. 


Dari tabel di atas juga terlihat ada 38 responden yang tergolong sedikit 
mengonsumsi minum Air Mineral, sedangkan 37 responden lainnya 
tergolong banyak mengonsumsi Air Mineral. Jika melihat semua variabel 
(USIA, BERAT dan seterusnya) terisi angka 38 atau 37 semuanya, maka 
pada kasus ini tidak ada data yang hilang (missing), sehingga total data untuk 
semua variabel adalah 75 buah. 


Tentu ini adalah keadaan yang ideal. Namun, jika pada sebuah kasus ada 
satu atau beberapa data yang hilang atau tidak tercatat, bisa dilakukan proses 
rata-rata untuk pengisian data yang kosong tersebut, atau menghilangkan 


data missing dari proses pembuatan model. 
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Variables EnterediRemoved? P3 


Min. D Sguared 


Between 


income 5 sedikit and 
banyak 

berat 5 sedikit and 
banyak 

tinggi sedikit and 
banyak 


At each step, the variable that maximizes the Mahalanobis distance between the two 
closest groups is entered. 


a. Maximum number of steps is 10. 
b. Maximum significance of F to enter is .05. 
Cc. Minimum significance of F to remove is 10. 


d. F level, tolerance, or VIN insufficient for further computation. 


Tabel ini menyajikan variabel mana saja -dari lima variabel input- yang bisa 
dimasukkan (entered) dalam persamaan diskriminan. 


Karena proses adalah stepwise (bertahap), maka akan dimulai dengan 
variabel yang mempunyai angka F hitung (statistic) terbesar. 


Tahap pemasukan variabel bebas: 


e Pada tahap pertama, angka F hitung variabel INCOME adalah yang 
terbesar, mencapai 8,656 maka pada tahap pertama ini, variabel 
INCOME terpilih. 


e Pada tahap kedua, dengan variabel yang sudah berkurang satu, angka F 
hitung variabel BERAT adalah kedua terbesar, mencapai 7,170 maka 
pada tahap kedua ini, variabel BERAT terpilih. 


e Pada tahap ketiga, dengan variabel yang sudah berkurang dua, angka F 
hitung variabel TINGGI adalah ketiga terbesar, mencapai 7,343 maka 
pada tahap ketiga ini, variabel TINGGI terpilih. 


Perhatikan ketiga variabel tersebut tentunya mempunyai angka Sig. di bawah 
0,05 seperti angka Sig. variabel INCOME yang adalah 4,367E-03 atau 
0,004367, jauh di bawah 0,05. 


Dengan demikian, dari lima variabel yang dimasukkan, hanya ada tiga 
variabel yang signifikan. Atau bisa dikatakan Income (pendapatan) 
Konsumen, Berat Badan serta Tinggi Badan konsumen memengaruhi 
perilaku konsumen tersebut untuk Sedikit atau Banyak minum air mineral. 
Bisa jadi mereka yang berusia lebih muda, atau mereka yang mempunyai 
Berat dan Tinggi badan di atas rata-rata akan mengonsumsi banyak air 
mineral. Atau berbagai kemungkinan lain yang akan diuraikan pada analisis 
selanjutnya. 
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Variables in the Analysis 


en Tolerance Remove Sguared Groups 
income d 


income 1 ) : sedikit and 
banyak 


berat : 1 2 sedikit and 


banyak 


income # 1 1 sedikit and 
banyak 
berat 1 | £ sedikit and 
banyak 


tinggi 2 3 5 sedikit and 
banyak 


Tabel di atas -dan tabel selanjutnya- sebenarnya hanyalah perincian (detail) 
dari proses stepwise pada tabel sebelumnya. Pada Step 1, variabel INCOME 
adalah variabel pertama yang masuk ke dalam Model Diskriminan. Hal ini 
disebabkan variabel tersebut mempunyai angka SIG. OF F TO REMOVE 
yang paling sedikit, yakni 0,004 (jauh di bawah 0,05). 


Kemudian pada step 2, dimasukkan variabel kedua, yakni BERAT. Variabel 
tersebut memenuhi syarat, karena mempunyai angka SIG. OF F TO 
REMOVE di bawah 0,05 yakni 0,026. 


Pada step 3 atau terakhir, dimasukkan variabel ketiga, yakni TINGGI. 
Variabel tersebut juga memenuhi syarat, dengan angka SIG. OF F TO 
REMOVE di bawah 0,05 yakni 0,012. Perhatikan perubahan angka pada 
variabel BERAT seiring dengan masuknya variabel ketiga, yakni variabel 
TINGGI. 


Variables Not in the Analysis 


ee || Min. Sig. of F to Min. D Between 
ep Tolerance Tolerance Enter Sguared Groups 
usia Aa : sedikit and 


banyak 


berat ! . sedikit and 
banyak 


tinggi 1 8 sedikit and 
banyak 


income 1 : sedikit and 
banyak 


olahraga 1 : sedikit and 
banyak 


usia £ : . : sedikit and 
banyak 


berat A 5 sedikit and 


banyak 


tinggi 1 4 3 sedikit and 
banyak 


olahraga | £ ' : sedikit and 
banyak 
usia 7 : 2 h sedikit and 
banyak 
tinggi 8 1 : sedikit and 
banyak 
olahraga : x $ sedikit and 
banyak 
usia & $ sedikit and 
banyak 


olahraga 5 5 . sedikit and 
banyak 


185 


Tabel di atas adalah kebalikan dari tabel sebelumnya, di mana pada tabel ini 
justru yang ditayangkan adalah proses pengeluaran variabel secara bertahap. 


e Pada step 0 (keadaan awal), kelima variabel secara lengkap ditayangkan 
dengan angka SIG. OF F TO REMOVE sebagai faktor penguji. Terlihat 
angka SIG. OF F TO REMOVE yang terkecil adalah pada variabel 
INCOME (angka 0,004). Maka variabel INCOME dikeluarkan dari step 
0 tersebut, yang berarti variabel tersebut bukan termasuk variabel yang 
tidak dianalisis. 


e Pada step 1, sekarang terlihat ada empat variabel, dan proses pengujian 
terus berjalan, dengan pedoman angka SIG. OF F TO REMOVE harus di 
bawah 0,05 dan jika mungkin diambil angka terkecil. Terlihat variabel 
BERAT sekarang mempunyai angka SIG. OF F TO REMOVE terkecil 
(0,026) sehingga variabel tersebut dikeluarkan. 


e Pada step 2, sekarang terlihat ada tiga variabel, dan terlihat variabel 
TINGGI pada step ini mempunyai angka SIG. OF F TO REMOVE 
terkecil (0,012) sehingga variabel tersebut dikeluarkan. 


e Pada step 3, sekarang terlihat hanya ada dua variabel, dan terlihat kedua 
variabel tersebut mempunyai angka SIG. OF F TO REMOVE di atas 
0,05 (yakni 0,524 untuk USIA dan 0,798 untuk OLAHRAGA). Karena 
sudah tidak ada variabel yang memenuhi syarat maka proses pengeluaran 
variabel berhenti, dan kedua variabel sisa tersebut tidak dikeluarkan, 
yang berarti keduanya termasuk pada VARIABLE NOT IN THE 
ANALYSIS, atau variabel yang tidak dianalisis lebih lanjut. 


Wilks' Lambda 


ep 
an oral, 
Kn Lambda Statistic df2 Sig, 


894 8.656 73.000 004 
7170 72.000 001 
7.343 71.000 .000 


Wilk's Lambda pada prinsipnya adalah varians total dalam discriminant 
scores yang tidak bisa dijelaskan oleh perbedaan di antara grup-grup yang 
ada. Perhatikan tabel di atas yang terdiri atas tiga tahap (step), yang terkait 
dengan tiga variabel yang secara berurutan dimasukkan pada tahapan analisis 
sebelumnya. 


Pada step 1, jumlah variabel yang dimasukkan ada satu INCOME), dengan 
angka Wilk's Lambda adalah 0,894. Hal ini berarti 89,4”6 varians tidak dapat 
dijelaskan oleh perbedaan antara grup-grup. Kemudian pada step 2, dengan 
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tambahan variable BERAT (lihat kolom NUMBER OF VARIABLES yang 
sekarang adalah 2), angka Wilk's Lambda turun menjadi 0,834. Dan pada 
step 3, angka itu turun lagi menjadi 0,763. Penurunan angka Wilk's Lambda 
tentu baik bagi model diskriminan, karena varians yang tidak bisa dijelaskan 
juga semakin kecil (dari 89,4”o menjadi 76,3Y6). 


Dari kolom F dan signifikansinya, terlihat baik pada pemasukan variable 1, 2, 
kemudian 3, semuanya adalah signifikan secara statistik. Hal ini berarti 
ketiga variable tersebut (INCOME, BERAT dan TINGGI) memang berbeda 
untuk kedua tipe konsumen. 


Summary of Canonical Discriminant Functions 


Eigenvalues 


Inction N Eigenvalue | SofVariance | Cumulative & Correlation 


1000 1000 


a. First 1 canonical discriminant functions were used in the analysis. 


Canonical Correlation mengukur keeratan hubungan antara discriminant 
score dengan grup (dalam hal ini, karena ada dua tipe konsumen, maka ada 
dua grup). Angka 0,487 menunjukkan keeratan yang cukup tinggi, dengan 
ukuran skala asosiasi antara 0 sampai 1. 


Yvilks' Lambda 


maarmama| 0S loan | al ca 
Lambda Chi-sguare 


—— ago asn og 


Tabel di atas menyatakan angka akhir dari Wilk's Lambda, yang sebenarnya 
sama saja dengan angka terakhir dari step 3 pembuatan model diskriminan 
(lihat table terdahulu). Angka Chi-Sguare sebesar 19,321 dengan tingkat 
signifikansi yang tinggi menunjukkan perbedaan yang jelas antara dua grup 
konsumen (mereka yang BANYAK minum dengan yang SEDIKIT minum). 
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Structure Matrix 


kun 


income 
usia? 
berat 
olahraga? 
tinggi 


Pooled within- 
groups correlations 
between 
discriminating 
variables and 
standardized 
canonical 
discriminant 
functions 
Variables ordered 
by absolute size of 
correlation within 
function. 


a. This variable not 
used inthe 
analysis. 


Tabel STRUCTURE MATRIX menjelaskan korelasi antara variable inde- 
penden dengan fungsi diskriminan yang terbentuk. Terlihat variable 
INCOME paling erat hubungannya dengan fungsi diskriminan, diikuti oleh 
variable USIA, BERAT dan seterusnya. Hanya di sini variable USIA dan 
OLAHRAGA tidak dimasukkan dalam model diskriminan (perhatikan tanda 
huruf a di dekat variable tersebut). Perhatikan tanda korelasi yang sama 
dengan tanda koefisien pada model Discriminant Score. 


Canonical Discriminant 


Function Coefficients 
In 

berat ' 
tinggi 
income 
(Constant) 

Unstandardized 

coefficients 


Tabel di atas mempunyai fungsi yang hampir mirip dengan persamaan regresi 
berganda, yang dalam analisis diskriminan disebut sebagai FUNGSI 
DISKRIMINAN: 


z Score— 7,884 0,064 BERAT-0,093 TINGGI -0,006 INCOME 


Kegunaan fungsi ini untuk mengetahui sebuah case (dalam kasus ini adalah 
seorang konsumen) masuk pada Grup yang satu, ataukah tergolong pada grup 
yang lainnya. 


Selain fungsi di atas, dengan dipilihnya FISHER FUNCTION 
COEFFICIENT pada proses analisis, maka akan terbentuk pula Fungsi 
Diskriminan Fisher (lihat pembahasan selanjutnya). 


Functions at Group 
Centroids 


OH 


| 1 
sedikit 542 
banyak - 557 


Unstandardized 
canonical 
discriminant 
functions 
evaluated at 
group means 


Karena ada dua tipe Konsumen, maka disebut Two-Group Discriminant, di 
mana grup yang satu mempunyai Centroid (Group Means) negatif, dan grup 
yang satu mempunyai Centroid (Group Means) positif. Angka pada table 
menunjukkan besaran Z yang memisahkan kedua grup tersebut. 


Gambar: 
BANYAK 
“0,557 


SEDIKIT 


N- 37 N- 38 


Terlihat distribusi anggota grup dengan kode 0 (SEDIKIT) dan kode 1 
(BANYAK), di mana dari 75 responden, 37 orang ada pada Grup BANYAK, 
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dan 38 orang ada pada grup SEDIKIT (komposisi anggota lihat penjelasan 
selanjutnya). 
Tampilan gambar di atas akan digunakan untuk menentukan apakah seorang 


Responden akan tergolong pada Grup SEDIKIT atau BANYAK (lihat 
penjelasan bagian CASEWISE RESULT). 


Prior Probabilities for Groups 


an re Cases Used in Analvsis 
min Prior Unweighted Weighted 


sedikit 500 38 
hanyak 500 3F 
Total 1.000 15 


Tabel di atas memperlihatkan komposisi ke 75 responden, yang dengan 
model diskriminan menghasilkan 37 responden ada di Grup BANYAK, 
sedang sisanya ada di grup SEDIKIT. 


Classification Function 
Coefficients 


NS 


berat 035 -035 


tinggi 3.587 3.690 
income 036 .030 


(Constant) | -297.882 | -306.557 


Fisher's linear discriminant 
functions 


Sama seperti tampilan Unstandardized (Canonical) sebelumnya, Fungsi 
Diskriminan dari Fisher pada prinsipnya membuat semacam persamaan 
regresi, dengan pembagian berdasar kode grup. 


Mereka yang minum air mineral dalam kategori SEDIKIT: 


SCORE- -297,882-0,03506 BERAT-3,587 
TINGGI--0,0364 1INCOME 


Mereka yang minum air mineral dalam kategori BANYAK: 


SCORE- -306,557-0,03481 BERAT--3,690 
TINGGI--0,03007INCOME 
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Selisih di antara grup SEDIKIT dengan BANYAK adalah: 


(-297,882-0,03506 BERAT--3,587 TINGGI--0,03641INCOME)- 
(-306,557-0,03481 BERAT-3,690 TINGGI--0,03007INCOME) 


atau: 
z Score— 8,675-0,06987 BERAT-0,103 TINGGI -0,0064 INCOME 


Perhatikan a score dari Fungsi Fisher hampir sama dengan fungsi 
Unstandardized sebelumnya: 


z Score— 7,884 0,064 BERAT-0,093 TINGGI -0,006 INCOME 


Untuk aplikasi pada penghitungan score pada Casewise Statistics, akan 
digunakan fungsi Unstandardized. Sedangkan fungsi Fisher sebenarnya 
bersifat proporsional dengan fungsi Unstandardized, yang untuk kasus ini, 
dengan mengalikan setiap koefisien dari Fisher dengan angka 0,9 maka akan 
diperoleh Fungsi z Score Unstandardized. 


CASEWISE STATISTICS 
(hanya ditampilkan sebagian) 


Casewise Statistics 
Discriminant 
Highest Group Second Highest Group Scores 
P(Dzd | Gzg) 
guarei Sguared 
Mahalanobis Mahalanobis 
Predictad Distance to Distance to 
he up p » 2g Dad Centroid p -g|D: Centroid 

Original 1 0 0 304 1 850 1.058 1 150 4527 1571 
2 0 0 237 1 870 1.397 Ah 130 5.203 1724 
3 Ii) 0 81 1 584 057 1 M6 739 303 
4 0 0 520 1 788 M3 1 12 3.034 1185 
5 0 0 783 1 575 076 1 425 677 266 
6 1 1 858 1 600 032 0 400 847 -.378 
7 0 ip 970 1 637 001 0 363 1127 -.520 
8 0 0 895 1 613 017 1 387 936 410 
g 1 Ti 088 1 923 2917 1 077 7.879 2.250 
10 0 0 078 1 927 3411 1 073 8196 2.306 
1 1) 0 514 1 789 425 1 21 3.067 1194 
12 0 0 17 1 114 080 1 286 190 825 
13 0 0 667 1 746 186 1 254 234 973 
14 1 o 760 1 567 094 1 433 629 236 
15 1 1 739 1 559 11 0 44 586 -18 
16 1 1 976 1 639 001 0 361 1144 -527 
17 1) 0 069 1 331 3.303 1 069 8.507 2.360 
18 1 1 933 1 667 007 0 333 1.399 -.640 


Tabel CASEWISE pada prinsipnya ingin menguji apakah model diskriminan 
yang terbentuk akan mengelompokkan dengan tepat seorang responden pada 
kategori minum BANYAK atau SEDIKIT. 


Sebagai contoh, lihat tampilan sebagian data responden mula-mula. 
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nama minum usia herat tinggi income jamkerja | olahraga 
1 RUSDI 0.00 40.00 65.00 154.00 680.00 5.33 3.0 
2 INA 0.00 30.00 70.00 157.00 700.00 5.30 36 
3 LANNY 0.00 25.00 60.00 158.00 580.00 5.27 35 
4 CITRA 26.00 75.00 160.00 600.00 5.33 3.0 
3 DINA 0.00 40.00 50.00 159.00 700.00 5.50 35 
6 SISKA 00 26.00 62.00 158.00 440.00 5.00 22 
ui LUSI 0.00 29.00 50.00 160.00 580.00 5.07 29 


Gambar 5.8. Tampilan Data Kasus 
e Untuk Responden 1 dengan nama RUSDI yang mempunyai kategori 
minum SEDIKIT dan data variabel: 
Berat-—65 kilogram 
Tinggi-154 centimeter 
Income— Rp.680,-/bulan (dalam ribuan) 
Maka perhitungan score untuk konsumen bernama Rusdi adalah: 
z Score— 7,884 4 (0,064“ 65)-(0,093"154) -(0,006”680) —1,802 


Jika dilihat pada kolom terakhir dari tampilan CASEWISE 
STATISTICS, terlihat angka DISCRIMINANT SCORE untuk case 
number 1 (nama Rusdi) adalah 1,571. Perbedaan angka 1,802 dengan 
1,571 disebabkan penyajian angka pada z score yang tidak lengkap 
(dilakukan pembulatan pada output SPSS). 


Seharusnya fungsi diskriminan adalah: 


z Score— 7,884 t0,0637 BERAT-0,093 TINGGI t0,0057 INCOME 


— Dengan demikian, konsumen Rusdi mempunyai score: 
z Score— 7,884 4 (0,0637" 65)-(0,093“154) H(0,0057“680) —1,5785 
NB: bandingkan dengan hasil di output sebesar 1,571. 


— Untuk case number 2 (nama NINA) dengan data variabel bisa dilihat 
pada file DISKRIMINAN.sav: 


z Score- 7,884 4 (0,0637# 70)-(0,093157) #(0,0057700) -1,732 


NB: bandingkan dengan hasil pada kolom DISCRIMINANT 
SCORE di Output CASEWISE, yang adalah 1,724. 


— Untuk case number 3 (nama LANNY) dengan data variabel bisa 
dilihat pada file DISKRIMINAN.sav: 
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z Score- 7,884 - (0,0637# 60)-(0,093#158) H(0,0057#580) -0,3022 


NB: bandingkan dengan hasil pada kolom DISCRIMINANT 
SCORE di Output CASEWISE, yang adalah 0,303. 


Demikian seterusnya bisa dilakukan pembuatan score untuk masing- 
masing konsumen. 


Score setiap konsumen (case) otomatis bisa ditampilkan pada DATA 
EDITOR atau file DISKRIMINAN.sav. Jika pada proses (kotak dialog) 
Diskriminan Analysis, buka option SAVE, dan aktifkan kotak 
DISCRIMINANT SCORE. 


Hasil score tersebut selanjutnya akan dibandingkan dengan cut off score, 
untuk mengetahui apakah case (konsumen) masuk ke Grup SEDIKIT ataukah 
Grup BANYAK. 


e Selanjutnya akan dijelaskan pembuatan cut off score (nilai batas). 


Dari tabel PRIOR PROBABILITIES FOR GROUPS, didapat bahwa 
jumlah responden SEDIKIT adalah 38 orang, sedangkan responden 
BANYAK adalah 37 orang. Dengan demikian, dikaitkan dengan angka 
grup centroid: 


(38 x 0,542)H37 x -0,557)- 20,59 - 20,60 atau praktis sama dengan 
0. 


Perhitungan Zcu (angka kritis): 
n N Z,#N,Z, 
N #Np 


Lcy 


di mana: 
Zcu-—Angka Kritis, yang berfungsi sebagai cut off score 


Na dan Ng-Jumlah sampel di grup A dan B, yang dalam kasus ini 
adalah grup SEDIKIT dan grup BANYAK. 


Z, dan Zz—angka centroid pada grup A dan B. 
Perhitungan: 
. 38.—0,557 437.0,542 
Ji 38437 
5 -0,01483 atau praktis sama dengan 0. 


Z 
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NB: perhatikan angka 38 dan 37 yang memang dibalik dibandingkan 
dengan angka grup centroid. 


Penggunaan angka Zcu ( Discriminating Z Score): 


Angka skor kasus di atas Zcu, masuk ke grup SEDIKIT (kode 0). 
Angka skor kasus di bawah Zcyu, masuk ke grup BANYAK (kode 1). 


Penggunaan angka 0 sebagai pembatas pada kasus ini karena kebetulan 


didapat angka yang praktis sama dengan nol. Pada banyak kasus lainnya, 


tentu angka pembatas bisa tidak sama dengan nol, seperti -2,4 atau #1,78 


dan seb againya. 
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Sebagai contoh: 


Case Number 1 (Rusdi) mempunyai score 1,571. Karena 1,57120, 
maka Rusdi masuk pada Grup 0 (SEDIKIT). 


Case Number 2 (Nina) mempunyai score 1,724. Karena 1,724-0, 
maka Nina masuk pada Grup 0 (SEDIKIT). Atau bisa dikatakan 
Nina termasuk tipe konsumen yang hanya sedikit mengonsumsi air 
mineral. 


Case Number 6 (Siska) mempunyai score -0,378. Karena -0,378 0 
maka Siska masuk pada Grup 1 (BANYAK). 


Demikian seterusnya semua responden bisa dikategorikan pada satu dan 
satu-satunya Grup tertentu, Grup SEDIKIT atau Grup BANYAK. 


Selain dengan melihat angka Discriminant Score seperti di atas, 
pengelompokan kasus pada Grup tertentu bisa langsung dilihat pada 
actual dan predicted Grup. 


Penafsiran dengan melihat setiap Baris: 


Pada baris 1 (Case 1): 


Actual Grup—0. Hal ini berarti data awal DISKRIMINAN.sav 
menyatakan case 1 dikategorikan sebagai Grup 0 (SEDIKIT). 


Predicted Group—0. Hal ini berarti dari hasil perhitungan score, case 
1 diprediksi masuk ke Grup—0. Karena sesuai dengan actual Grup 
yang juga 0, berarti fungsi diskriminan mampu mengategorikan case 
dengan tepat. 


P(G-g|D-d)-0.850 pada Highest Group. Hal ini berarti kemung- 
kinan case 1 tepat diklasifikasikan ke grup 0 adalah 8556. 


P(G-g|D-d)-0.150 pada Second Highest Group. Hal ini berarti 
kemungkinan case 1 TIDAK tepat diklasifikasikan ke grup 0 adalah 
1599. 


Perhatikan jumlah kedua kemungkinan adalah (8549156) 100Yo. 
— Pada baris 7 (Case 7): 


Actual Grup—0. Hal ini berarti data awal DISKRIMINAN.sav 
menyatakan case 7 dikategorikan sebagai Grup 0 (SEDIKIT). 


Predicted Group-1. Hal ini berarti dari hasil perhitungan score, case 
1 diprediksi masuk ke Grup-1. Karena TIDAK sesuai dengan actual 
Grup yang adalah 0, berarti fungsi diskriminan tidak mampu 
mengategorikan case dengan tepat. Hal ini ditandai dengan tanda ““ 
pada angka 1 di case 7 tersebut. 


Demikian seterusnya untuk kasus lainnya, dengan beberapa kasus 
tidak tepat diklasifikasikan, sehingga diberi tanda "“. 


Setelah fungsi Diskriminan dibuat, kemudian klasifikasi dilakukan, maka 
selanjutnya akan dilihat seberapa jauh klasifikasi tersebut sudah tepat? Atau, 
berapa persen terjadi misklasifikasi pada proses klasifikasi tersebut, yang 
akan dijelaskan berikut ini. 


Classification ResultP:€ 


Predicted Group 
Membership 
MINUM .00 sedikit | 1.00 banyak | Total 


Count .00 sedikit 
1.00 banyak 
Yo .00 sedikit 
1.00 banyak 
Cross-validateda Count .00 sedikit 
1.00 banyak 
.00 sedikit 
1.00 banyak 


a. Cross validation is done only forthose cases in the analysis. In cross 
validation, each case is classified by the functions derived from all cases 
other than that case. 


b. 68.076 of original grouped cases correctly classified. 


C. 68.0”o of cross-validated grouped cases correctly classified. 


Pada bagian ORIGINAL, terlihat bahwa mereka yang pada data awal adalah 
tergolong SEDIKIT, dan dari klasifikasi Fungsi Diskriminan tetap pada 
kelompok SEDIKIT, adalah 27 orang. Sedang dengan model diskriminan, 
mereka yang awalnya masuk grup SEDIKIT, ternyata menjadi anggota grup 
BANYAK adalah 11 orang. 
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Demikian juga dengan grup BANYAK, yang tetap pada grup BANYAK 
sejumlah 24 orang, dan yang “meleset” adalah 13 orang. 


Dengan demikian, ketepatan prediksi dari model adalah: 
(27424//75—0,68 atau 684. 


Karena angka ketepatan tinggi (686) maka model diskriminan di atas 
sebenarnya bisa digunakan untuk analisis diskriminan. Atau penafsiran 
tentang berbagai tabel yang ada (lihat seluruh pembahasan di atas) valid 
untuk digunakan. 


Pendapat lain mengatakan bahwa klasifikasi di atas terlalu optimis, dan 
tidak memperhitungkan berbagai bias yang mungkin terjadi. Untuk itu, 
disarankan juga penggunaan metode Leave-one-out cross validation, untuk 
mengurangi bias yang mungkin terjadi pada proses klasifikasi di atas. Dari 
keterangan tabel paling bawah didapat angka ketepatan klasifikasi data ke 
grup dengan metode Leave-one-out cross validation, yaitu tetap 6896, yang 


masih bisa dikategorikan ketepatan klasifikasi tetap tinggi. 


Setelah terbukti bahwa Fungsi Diskriminan mempunyai ketepatan prediksi 
yang tinggi, maka fungsi diskriminan tersebut bisa digunakan untuk 
memprediksi sebuah kasus, apakah akan diklasifikasikan ke tipe SEDIKIT 
ataukah tipe BANYAK. 


Contoh Kegunaan Fungsi Diskriminan 


Jika ada seorang konsumen bernama LUCKY dengan berat badan 
70 kilogram, tinggi badan 175 centimeter, dan mempunyai income rata-rata 
Rp.1.000.000,- per bulan, maka dengan memasukkan data tersebut ke dalam 
fungsi diskriminan: 


z Score- 7,884 “(0,0637”70)-(0,093175)-(0,0057#1000)—1,768 


NB: perhatikan angka 1.000.000 dimasukkan sebagai 1000, karena data 
income dalam ribuan rupiah. 


Karena angka skor (#1,768) di atas Zcu, maka kasus masuk ke grup 
SEDIKIT. Atau, konsumen bernama LUCKY termasuk tipe konsumen yang 
sedikit meminum air mineral. 


Demikian seterusnya, sejauh data mengenai berat badan, tinggi badan dan 
income seseorang diketahui, maka bisa dilakukan klasifikasi tipe minum 
orang tersebut. 
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4. KESIMPULAN 


Dari proses diskriminan, dimulai dari uji variabel sampai analisis output, 
didapat kesimpulan yang terkait dengan tujuan pada kasus awal (lihat kasus 
sebelumnya). 


e ADA perbedaan yang signifikan antara Mereka yang banyak minum 
AMDK dengan mereka yang sedikit meminumnya. Hal ini dibuktikan 
pada analisis Wilk's Lambda. 


e Variabel yang membuat perilaku konsumsi air mineral mereka berbeda 
adalah BERAT BADAN, TINGGI BADAN dan INCOME. Hal ini 
terlihat pada step analisis awal, baik pada bagian VARIABLE IN 
ANALYSIS maupun VARIABLE NOT IN ANALYSIS. 


e Model atau fungsi diskriminan untuk kasus tersebut adalah: 
z Score— 7,884 “0,0637 BERAT-0,093 TINGGI -0,0057 INCOME 


e Model (fungsi) diskriminan di atas mempunyai ketepatan mengklasifi- 
kasi kasus sebesar 68Y9. Karena di atas 50”6, ketepatan model dianggap 
tinggi, dan model di atas bisa digunakan untuk mengklasifikasi sebuah 
kasus pada tipe minum tertentu. 


53 Analisis Diskriminan Tiga Faktor 


Kasus ini merupakan pengembangan lebih lanjut dari model diskriminan 
terdahulu. Jika kasus sebelumnya hanya ada dua kategori untuk variabel 
dependen, sekarang akan dibahas pembuatan model diskriminan dan 
pengujiannya untuk tiga kategori (Multiple Discriminant Analysis). 


KASUS 


Data untuk kasus ini sama dengan kasus sebelumnya, yakni profil 75 pembeli 
Air Mineral Dalam Kemasan (AMDK), yang terdiri atas USIA, BERAT, 
TINGGI, INCOME, JAM KERJA dan OLAHRAGA. Namun kasus ini 
mengembangkan Dependent Variable atau variabel tergantung yang adalah 
variabel MINUM, dengan tiga kode, yakni: 


e Kode O untuk kategori minum SEDIKIT 
e Kode 1 untuk kategori minum SEDANG 
e Kode 2 untuk kategori minum BANYAK 
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Analisis Diskriminan pada kasus ini bertujuan untuk mengetahui: 


1. Apakah ada perbedaan yang signifikan antara ketiga tipe responden 
tersebut? Atau, apakah mereka yang tergolong minum sedikit air mineral 
mempunyai perbedaan (dalam usia, berat badan, tinggi badan, income 
per bulan, jam kerja dan waktu berolahraga) dengan mereka yang 
termasuk peminum sedang dan banyak? 


2. Jika memang ketiga perilaku berbeda, variabel mana yang membedakan 
perilaku minum ketiga kelompok konsumen tersebut? Apakah Usia 
seseorang, Berat Badannya, atau yang lainnya. 


3. Membuat fungsi diskriminan untuk menentukan apakah seseorang ter- 
masuk pada tipe peminum SEDIKIT, SEDANG ataukah BANYAK. 


4. Menguji apakah fungsi diskriminan yang terbentuk mempunyai tingkat 
ketepatan yang cukup tinggi untuk menggolongkan ketiga tipe konsumen 
tersebut. Sebagai contoh, jika pada data awal konsumen bernama Rusdi 
termasuk tipe peminum air mineral SEDIKIT, apakah fungsi diskriminan 
yang terbentuk mampu dengan tepat mengklasifikasikan Rusdi pada tipe 
SEDIKIT? Jika tidak semua konsumen bisa diklasifikasikan dengan 
tepat, berapa persen ketepatan prediksi fungsi diskriminan tersebut? 


Keempat tujuan di atas sebenarnya merupakan tujuan dasar dari setiap 
analisis diskriminan, walaupun dalam pengolahan SPSS, hal itu tidak bisa 
dijelaskan secara berurutan. Juga berbeda dengan kasus sebelumnya untuk 
diskriminan dua faktor, pada kasus ini tidak disertakan proses pengujian 
variabel terlebih dahulu. Keenam variabel akan diproses secara bersama- 
sama, walaupun tetap menggunakan proses bertahap (stepwise). 


DATA 
Data yang digunakan adalah DISKRIMINAN 3 FAKTOR.sav. 


NB: Data ini hampir sama dengan data DISKRIMINAN.sav seperti kasus 
sebelumnya. Pengubahan input hanya ada pada variabel MINUM dan USIA. 


Langkah 
Proses Analisis Diskriminan 


Karena ada tiga kategori pada variabel dependent (MINUM), maka yang 
akan dibuat adalah model dua faktor. 


e Buka file diskriminan 3 faktor. 


e Menu Analyze 5 Classify 5 Discriminant.... Tampak di layar: 
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BJ Discriminant Analysis 


8 


ea Na ————— 
si Grouping Variable: Ta 
minum J 
£ usia 
£ berat 
& tinggi Independents: 
£ income 
$$ iamkerja 


& darraga 


lassity.. 


Io 


Save 


ke) 


3) Enter independents together 


') Use stepwise method 
Selection Variable: 


Reset || cancet || Helo 


Gambar 5.9. Kotak Dialog Discriminant Analysis 


Pengisian (mirip dengan pengisian pada kasus sebelumnya). 
— Masukkan variabel minum ke bagian GROUPING VARIABLE. 
— Kemudian buka ikon DEFINE RANGE..., hingga tampak di layar: 


3 Discriminant Analysis: Define Range (ni3mj 


Minimum: Il | 


Maximum: | 


| Cancel || Help | 


Gambar 5.10. Kotak Dialog Define Range 


Sesuai kode untuk variabel MINUM: 
e Masukkan angka 0 pada Minimum. 


e Masukkan angka 2 pada Maximum. 


Perhatikan pemasukan hanya angka minimum dan maksimum. Jika ada 


5 kategori (angka Ol, 2, 3, dan 4), maka angka maksimum tentunya 


adalah 4. 


Tekan tombol CONTINUE untuk kembali ke kotak dialog utama. 


— Masukkan variabel usia, berat, tinggi, income, jamkerja dan 
olahraga ke dalam kotak INDEPENDENT. 


— Klik ikon STATISTICS. Tampak di layar: 
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F3 Discriminant Analysis: Statistics 
Descriptives Matrices: 


teans| (C1 within-aroups correlation 


(HUnivariate anovas | | (“Jwithin-groups coyariance 
Box Mm (H separate-groups covariance 


1 
Function Coefficients» | H Tgl covariance 
(“JFishers 


(HJ Unstandardized 


(continue J| cancet || Hem | 


Gambar 5.11. Kotak Dialog Statistics 


Pengisian: 


e Pada bagian DESCRIPTIVES, aktifkan pilihan Univariate 
ANOVAs. 


e Pada bagian FUNCTION COEFFICIENTS, aktifkan hanya 
pilihan Unstandardized. 


Abaikan bagian lain, tekan CONTINUE untuk kembali ke kotak 
dialog utama. 


e Perhatikan bagian tengah kotak dialog utama. Klik mouse pada pilihan 
Use stepwise method, maka secara otomatis ikon METHOD akan 
terbuka (aktif). Klik ikon METHOD tersebut. Tampak di layar: 


FB Discriminant Analysis: Stepwise Method Sa 
Method Criteria 
@ Wiks' lambaal 5) Use F value 
(O Unexplsined variance tnry (sae | Remeveh (271 | 
(O Mahalanobis distance 
(O Smalest F ratio ) Use probability of F 
ORaos V 
Display 
7) Summary of steps F tor pairwise distances 
Continue Cancel | J..hetp i ) 


Gambar 5.12. Kotak Dialog Stepwise Method 


Pengisian: 
— Pada bagian METHOD, pilih Mahalanobis distance. 


— Pada bagian CRITERIA, pilih Use Probability of F, namun jangan 
mengubah isi yang sudah ada (default). 


— Pada bagian DISPLAY, aktifkan pula kotak F for pairwise 
distances. 
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Pilihan ini untuk mengetahui kelompok mana yang paling berbeda (paling 


jauh jaraknya) dan mana yang paling dekat dengan kelompok lainnya. 


Abaikan bagian yang lain, kemudian tekan CONTINUE untuk kembali 
ke kotak dialog utama. 


e Klik ikon CLASSIFY. Tampak di layar: 


Pengisian: 


FE Discriminant Analysis: Classification sa 

Prior Probabilities: Use Covariance Matrix: 

@ Bitoroups oual @ within-aroups 

(O Sompute trom group sizes (O Separate-groups 

Display Plots 

CH casewise results “) Combined-groups 
(UJseparate-groups 

(1 Summary table Teritorial map 

(“Leaye-one-out classification 


|) Replace missing values with mean 


(continue J| cancet || Hem | 


Gambar 5.13. Kotak Dialog Classification 


Pada bagian DISPLAY, aktifkan pilihan Casewise results. 


Pada bagian PLOTS, aktifkan pilihan Territorial map. 


Masih pada bagian DISPLAY, aktifkan juga pilihan Leave-one-out- 
classification. 


Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak 


dialog utama. 


e Klik ikon SAVE. Tampak di layar: 


Discriminant scores 


Probabilties of group membership 


Export model information to XML file 


| | erowse.... | 


Continue || cancel || Hee | 


Gambar 5.14. Kotak Dialog Save 


BEJ Discriminant Analysis: Save Sen 
Predicted aroup membership) 


Kotak dialog SAVE berfungsi untuk menyimpan hasil proses analisis 


diskriminan dalam bentuk variabel baru di DATA EDITOR. 
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Pengisian: 


— Aktifkan pilihan Prediction group membership, dan Discriminant 
scores. 


Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak 
dialog utama. 


Abaikan ikon yang lain, dan tekan OK untuk proses data. 


Output dan Analisis 
Ada dua jenis output yang dihasilkan. 


1. Output berupa Data File baru (tipe sav) yang berisi data semula dengan 
tambahan tiga variabel (kolom) baru hasil proses diskriminan. Output 
tersebut bisa dilihat pada file diskriminan 3 faktor hasil.sav. Penjelasan 
ketiga kolom tersebut akan terkait dengan penjelasan output lainnya. 


2. Output dengan ekstensi spo seperti standar output SPSS, yang bisa 
disimpan dengan nama diskriminan 3 faktor.spv. 


OUTPUT AKAN DITAMPILKAN PER BAGIAN UNTUK ANALISIS, 
DENGAN CATATAN TIDAK SEMUA OUTPUT DITAMPILKAN. 


Uji Variable 


Tests of Eguality of Group Means 


ale lalala 
Lambda F dfi df2 Sig. 
E 026 


usia 72 
berat 


tinggi 
income 


jamkerja 
olahraga 


Tabel di atas berfungsi untuk menguji apakah ada perbedaan yang signifikan 
antar-grup untuk setiap variabel. 


Pedoman (lihat angka Sig. untuk F test): 
e Jika Sig. » 0,05 berarti tidak ada perbedaan antar-grup. 
e Jika Sig. « 0,05 berarti ada perbedaan antar-grup. 
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Contoh analisis menggunakan uji F: 


o Variabel USIA, angka Sig. adalah di bawah 0,05 (0,026). Hal ini 
berarti ada perbedaan antar-grup, atau konsumen yang sedikit, 
sedang atau banyak minum air mineral dipengaruhi oleh usia 
konsumen tersebut. Mungkin saja, makin tua seseorang, orang 
tersebut cenderung lebih banyak mengonsumsi air mineral. Atau 
kemungkinan lainnya yang akan dibahas pada penafsiran fungsi 
diskriminan. 


o Variabel TINGGI, angka Sig. Di atas 0,05 (0,557). Hal ini berarti 
tidak ada perbedaan antar-grup, atau responden yang sedikit, sedang 
atau banyak minum air mineral tidak dipengaruhi oleh tinggi badan 
konsumen tersebut. Seseorang yang dianggap tinggi ternyata 
mengonsumsi air mineral yang relatif sama dengan mereka yang 
dianggap pendek atau sedang tinggi tubuhnya. 


Dari enam variabel, hanya tiga variabel yang berbeda secara signifikan untuk 
tiga grup, yaitu USIA, BERAT, dan OLAHRAGA. Hal ini berarti perilaku 
minum air mineral dipengaruhi oleh usia seseorang, berat badannya dan 
waktu yang dihabiskan untuk melakukan aktivitas olahraga. Namun demi- 
kian, hal ini tidak menjamin apakah tiga variabel tersebut akan dimasukkan 
pada fungsi diskriminan. Untuk itu, dilakukan analisis diskriminan dengan 
tetap menyertakan seluruh variabel yang ada. 


Variabel yang Membentuk Fungsi Diskriminan 


Variables EnterediRemoved? 5:59 


Min. D Sguared 
Exact F 


Pe ea ae ag aa 
ep Entered Statistic Groups Statistic dri df2 Sig. 


1 usia 093 | sedang and 1.083 1 72.000 .302 
banyak 
2 berat 162 | sedang and 929 2 71.000 400 
banyak 
At each step, the variable that maximizes the Mahalanobis distance between the two 
closest groups is entered. 
a. Maximum number of steps is 12. 
b. Maximum significance of F to enteris .05. 


c. Minimum significance of F to remove is 10. 
d. F level, tolerance, or VIN insufficient for further computation. 


Dari tabel di atas, ternyata hanya dua variabel yang akan digunakan untuk 
membentuk fungsi diskriminan, yakni variabel USIA dan BERAT. Sedang- 
kan variabel OLAHRAGA ternyata tidak masuk dalam fungsi diskriminan. 
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Proses Pemasukan Variabel Dilihat dari Angka Wilk's Lambda 


Wilks' Lambda 


Number of Exact F 
ES Variabies Lambda df3 Statistic df2 Sig. 


- 2 3.821 72.000 | 2.648E-02 
4.456 142.000 | 2.015E-03 


Pada step 1, jumlah variabel yang dimasukkan ada satu (USIA), dengan 
angka Wilk's Lambda adalah 0,904. Hal ini berarti 90,4Y6 varians tidak dapat 
dijelaskan oleh perbedaan antara grup-grup. Kemudian pada step 2, dengan 
tambahan variable BERAT (lihat kolom NUMBER OF VARIABLES yang 
sekarang adalah 2), angka Wilk's Lambda turun menjadi 0,789. Penurunan 
angka Wilk's Lambda tentu baik bagi model diskriminan, karena varians 
yang tidak bisa dijelaskan juga semakin kecil (dari 90,4” menjadi 78,9Yo). 


Dari kolom F dan signifikansinya, terlihat baik pada pemasukan variable 1 
ataupun 2, semuanya adalah signifikan secara statistik. Hal ini berarti kedua 
variabel tersebut (USIA dan BERAT) memang berbeda untuk ketiga tipe 
konsumen. 


Analisis Perbedaan Antar-Grup Konsumen 


Pairwise Group Comparisong? 


Step MINUM .00 sedikit | 1.00 sedang | 2.00 banyak 
1 : : 


.00 sedikit 


1.00 sedang 


2.00 banyak 


.00 sedikit 


1.00 sedang 


2.00 banyak 


a. 1, 72 degrees of freedom for step 1. 
b. 2, 71 degrees of freedom for step 2. 


Tabel ini berkaitan dengan penjelasan angka Wilk's Lambda sebelumnya, di 
mana ada dua tahapan (proses) yang menghasilkan dua variabel pada 
pembentukan fungsi diskriminan. 
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Pada step kedua yang merupakan proses akhir, terlihat jarak (distance) antara 
Grup SEDIKIT (kode 0) dengan Grup BANYAK (kode 2) adalah yang 
terbesar, yakni 8,697. Sedangkan jarak terkecil adalah antara Grup SEDANG 
(kode 1) dengan Grup BANYAK (kode 2), yakni 0,929. 


Dengan demikian, bisa dikatakan bahwa Konsumen di Grup SEDIKIT paling 
berbeda profilnya (Usia dan Berat Badannya) dibandingkan dengan mereka 
yang banyak minumnya. Sebaliknya, Usia dan Berat Badan konsumen yang 
konsumsi air mineralnya termasuk sedang, mempunyai perbedaan yang kecil 
dengan mereka yang konsumsinya termasuk banyak. 


Menguji Perbedaan Antar-Grup Konsumen 


Summary of Canonical Discriminant Functions 


Eigenvalues 


Canonical 
Function | Eigenvalue | Yo of Variance | Cumulative Yo | Correlation 


1 .2668 99.7 99.7 458 
2 .0012 3 100.0 .030 


a. First 2 canonical discriminant functions were used in the 
analysis. 


Jika pada kasus dua grup seperti pada kasus sebelumnya, otomatis akan 
terbentuk satu fungsi diskriminan (function). Karena memang sebuah fungsi 
diskriminan berfungsi untuk menempatkan sebuah kasus pada pilihan dua 
grup tertentu, apakah akan masuk ke grup yang satu atau ke grup yang lain. 


Dengan demikian, secara logika, jika ada tiga grup seperti pada kasus di atas, 
akan terbentuk dua fungsi diskriminan, dengan kriteria: 


FUNCTION 1 FUNCTION 2 


—-—-c—v-vcwuv-—--—2 
Grup SEDIKIT Grup SEDANG Grup BANYAK 


e Fungsi Diskriminan 1 untuk memilah mana yang masuk ke Grup 
SEDIKIT atau ke Grup SEDANG. 


e Fungsi Diskriminan 2 untuk memilah mana yang masuk ke Grup 
SEDANG atau ke Grup BANYAK. 


Dengan demikian, jika ada empat grup, maka akan terbentuk tiga fungsi 
diskriminan, dan seterusnya. 


Sekarang perhatikan angka Canonical Correlation yang mengukur keeratan 
hubungan antara discriminant score dengan grup (dalam hal ini, karena ada 
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tiga tipe konsumen, maka ada tiga grup). Angka 0,458 menunjukkan keeratan 
yang cukup tinggi, dengan ukuran skala asosiasi antara 0 sampai 1. Dan 
walaupun angka canonical untuk fungsi kedua (function 2) dengan grup 
adalah lemah (0,03), namun kedua fungsi tetap digunakan untuk interpretasi 
selanjutnya. Hal ini bisa dilihat pada keterangan pada bagian bawah tabel 
output. 


Wilks' Lambda 


Wilks' 
Test of Function(s) | Lambda | Chi-sguare df Sig. 


1 through 2 189 16.908 41 .002 
2 999 .065 1 199 


Dari tabel Wilk's Lambda, pada kolom TEST OF FUNCTIONIS) 1 
THROUGH 2 menguji hipotesa: 


e Ho: Tidak ada perbedaan Rata-rata (Centroid) dari kedua fungsi 
diskriminan. 


e Hi: Ada perbedaan Rata-rata (Centroid) yang jelas dari kedua fungsi 
diskriminan. 


Untuk menguji Hipotesa, angka Wilk's Lambda ditransformasikan ke angka 
Chi-Sguare, dengan ketentuan: 


e Angka Sig. » 0,05 maka Ho diterima. 
e Angka Sig. « 0,05 maka Ho ditolak. 


Terlihat angka Chi Sguare hitung adalah 16,908 dengan signifikansi 0,002, 
yang jauh di bawah 0,05. Karena itu, Ho ditolak, atau memang ada perbedaan 
yang nyata (signifikan) antara Rata-rata (centroid) dari kedua fungsi diskri- 
minan yang telah terbentuk. Karena ada perbedaan yang nyata, maka perilaku 
minum untuk ketiga tipe konsumen memang berbeda (lihat tujuan pertama 
dari kasus di atas). Bisa dikatakan, usia dan berat dari mereka yang sedikit, 
sedang atau banyak minum air mineral memang berbeda. 


Kemudian beralih ke baris 2. Interpretasi sama persis dengan baris 1, hanya 
di sini fungsi diskriminan pertama dikeluarkan, sehingga hanya fungsi kedua, 
yang mengategorikan antara mereka yang tipe minumnya SEDANG, dengan 
mereka yang tipe minumnya BANYAK. 


Hipotesa 


Ho: Tidak ada perbedaan Rata-rata (Centroid) dari fungsi diskriminan 
kedua (variabel usia dan berat pada tipe SEDANG dengan tipe 
BANYAK). 
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Hi: Ada perbedaan Rata-rata (Centroid) yang jelas dari fungsi 
diskriminan kedua (variabel usia dan berat pada tipe SEDANG dengan 
tipe BANYAK). 


Untuk menguji Hipotesa, angka Wilk's Lambda ditransformasikan ke angka 
Chi-Sguare. Karena hasil angka Sig. adalah 0,799 yang jauh di atas 0,05 
maka Ho diterima, atau jika fungsi diskriminan kedua berdiri sendiri, justru 
tidak ada perbedaan antara usia dan berat dari tipe minum SEDANG dan 
BANYAK. 


Dengan demikian, seharusnya kedua fungsi diskriminan digunakan secara 
bersama-sama, dan tidak bisa hanya mengambil fungsi diskriminan kedua 
saja. 


Penamaan Fungsi Diskriminan Satu dan Dua 


Setelah pada analisis sebelumnya terbukti bahwa kedua fungsi diskriminan 
harus dimasukkan semuanya untuk interpretasi selanjutnya, analisis dilan- 
jutkan dengan upaya menamakan kedua fungsi tersebut. 


Structure Matrix 


0 -m 
PA enenas 


berat 
tinggi? 


jamkerja? 
usia 
income? 
olahraga? 


Pooled within-groups 
correlations between 
discriminating variables and 
standardized canonical 
discriminant functions 
Variables ordered by 
absolute size of correlation 
within function. 


“ Largest absolute 
correlation between each 
variable and any discriminant 
function 


a. This variable not used in 
the analysis. 


Pada kasus ini, tabel STRUCTURE MATRIX menjelaskan korelasi antara 
variabel independen dengan dua fungsi diskriminan yang terbentuk. Per- 
hatikan variabel-variabel dengan tanda huruf a di kiri atas nama variabel 
tersebut, yang menunjukkan variabel termaksud tidak diikutkan pada fungsi 
diskriminan. 


207 


Dari kriteria tersebut, hanya dua variabel independen yang lolos uji, yakni 
BERAT dan USIA. Dan jika dilihat dari besar korelasi (abaikan tanda - jika 
ada): 


e Korelasi variabel BERAT dengan fungsi 1 (0,812) lebih besar daripada 
korelasi variabel tersebut dengan fungsi 2 (0,583). Dengan demikian, 
variabel BERAT masuk ke fungsi diskriminan 1. 


e Korelasi variabel USIA dengan fungsi 2 (0,776) lebih besar daripada 
korelasi variabel tersebut dengan fungsi 1 (0,630). Dengan demikian, 
variabel USIA masuk ke fungsi diskriminan 2. 


Perhatikan tanda " pada angka yang lebih besar jika dibandingkan per baris. 


Pengertian variabel BERAT dan USIA akan dijelaskan lebih lanjut di 
Territorial Map. 


Membuat Fungsi Diskriminan 1 dan 2 


Fungsi diskriminan -untuk menjawab tujuan ketiga pada kasus ini- dibentuk 
dengan informasi berikut. 


Canonical Discriminant Function 
Coefficients 


Gin 
093 : 


usia 
berat 
(Constant) 


Unstandardized coefficients 


Fungsi Diskriminan 1 (lihat angka pada kolom FUNCTION 1): 
Z Score 1- -7,169-(0,093 USIA)-(0,079 BERAT) 
Fungsi Diskriminan 2 (lihat angka pada kolom FUNCTION 2): 
Z Score 2- -0,5164(0,129 USIA)-(0,064 BERAT) 


Terkait dengan penjelasan mengenai fungsi dari Discriminant Function, maka 
hubungan kedua fungsi bisa diperlihatkan pada gambar berikut. 


Z 15-711-(0,09 U)-(0,07 B) Z 2—-0,5-(0,12 U)-(0,064 B) 


b—--—-w-w—. 
Grup SEDIKIT Grup SEDANG Grup BANYAK 
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Penggunaan 


Perhatikan sebagian data dari file diskriminan 3 faktor hasil.sav yang 
memuat tiga kolom tambahan sebagai hasil proses diskriminan. 


nama minum Usia berat tinggi |. income | jamkerja | olahraga | Dis." Dist Dis2 

1 RUSDI 000 40.00 Ga) 1400 68000 533 30 0 1164820 4806 
KERAP NINA D0 4000 0-0 M0 53) 36 00 204173 16096 
3 LANNY 0004000 GA00 15800 56000 527 35 UI) 25466 80024 

4 CITRA 00-90 I500- 16000 60000 533 30 00 234273 028148 
EN DINA 000 4000 50 1900 70000 580 35 II) 46759 43057 
6 SISKA 10 20 6200 15800 44000 500 22 UI) 30161 087317 


Gambar 5.15. Hasil Proses Data (Diskriminan) 


e Untuk kasus konsumen dengan nama RUSDI dengan data: 
USIA- 40 tahun dan BERAT- 65 kilogram 
Z Score 1- -7,169-(0,093“40)(0,079“65)-1,686 


NB: perbedaan dengan hasil output pada kolom DISI 1 sebesar 1,648 
karena adanya pembulatan. 


Z Score 2- -0,516#(0,129"40)-(0,064#65)-0.484 


NB: perbedaan dengan hasil output pada kolom DIS2 1 sebesar 0,480 
karena adanya pembulatan. 


e Penjelasan kolom DIS 1 pada file diskriminan 3 faktor hasil.sav. 


Jika dilihat pada kasus konsumen dengan nama RUSDI, terlihat output 
(baris 1 kolom DIS 1) menempatkan RUSDI pada konsumen dengan 
tipe SEDIKIT. Dari mana kesimpulan tersebut didapat? 


Seperti dilihat pada gambar di atas, fungsi Z score 1 akan memilah 
konsumen dengan tipe SEDIKIT atau SEDANG, sedangkan fungsi Z 
score 2 akan memilah konsumen dengan tipe SEDANG atau BANYAK. 
Pada kasus diskriminan 2 faktor, hal tersebut mudah dilakukan, karena 
hanya ada satu fungsi diskriminan, serta hanya ada dua kode (tipe). 
Dengan menetapkan Zcu sebagai cutting score, maka pemasukan input 
segera menempatkan kasus pada tipe tertentu. 


Namun, jika kasus menggunakan tiga kode yang menghasilkan dua 
fungsi diskriminan, cara memilah dengan menetapkan Zcu menjadi 
sangat kompleks. Untuk itu, pada kasus dengan lebih dari dua kode, 
penggunaan TERRITORIAL MAP akan lebih efektif untuk menentukan 
penempatan sebuah data pada kode (tipe) tertentu. 
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Territorial Map pada dasarnya memetakan (mapping) batas-batas setiap 
kode berdasar sumbu X (fungsi diskriminan 1) dan sumbu Y (fungsi 
diskriminan 2), sehingga dengan melihat koordinat sebuah kasus, dengan 
mudah akan dilihat kasus tersebut ada di teritori (daerah) mana. 


Untuk dua fungsi dan tiga tipe konsumen seperti kasus, teritori map 
secara teori adalah: 


Tipe SEDIKIT Fungsi Disk. 2 


Tipe SEDANG 


Tipe BANYAK 


Fungsi Disk. 1 


Catatan 
e Gambar di atas hanyalah contoh bagaimana melakukan mapping. 


e Jika ada 4 tipe (kode) atau lebih, dimungkinkan terjadi fungsi diskri- 
minan ketiga, yang membuat mapping menjadi kompleks karena adanya 
tiga sumbu (X, Y dan Z). 


Mengetahui centroid (rata-rata tiap grup) dengan Tabel dan Grafik 


Centroid adalah nilai rata-rata dari fungsi Z score dari setiap objek yang ada 
pada grup. Dalam hal ini, objek adalah para konsumen, dan karena ada tiga 
grup, maka akan ada tiga centroid. Jadi, ada satu centroid yang menyatakan 
nilai rata-rata dari semua data konsumen yang ada di grup SEDIKIT, satu 
centroid yang menyatakan nilai rata-rata dari semua data konsumen yang ada 
di grup SEDANG dan satu centroid yang menyatakan nilai rata-rata dari 
semua data konsumen yang ada di grup BANYAK. 


Kegunaan centroid pada dasarnya untuk mengetahui bagaimana penyebaran 
data dari tiap grup, dan bagaimana kedekatan antar-centroid dari masing- 
masing grup. Pada satu grup, misal grup SEDIKIT, yang mempunyai titik 
centroid tertentu, seharusnya data-data konsumen di grup SEDIKIT akan 
'bergerombol' di sekitar centroid-nya. Sedang di sisi lain, jika centroid grup 
SEDIKIT dengan grup BANYAK lebih jauh dibanding jarak centroid grup 
SEDIKIT dengan grup SEDANG, maka bisa dikatakan karekteristik data 
grup SEDIKIT dengan karekteristik grup BANYAK lebih berbeda diban- 
dingkan antara grup SEDIKIT dengan grup SEDANG, atau mungkin antara 
grup BANYAK dengan grup SEDANG. 
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Pada output, centroid bisa ditampilkan dengan dua cara, yakni: 
TABEL 


Functions at Group Centroids 


| tata 


sedikit 


sedang 
banyak 


Unstandardized canonical 
discriminant functions 
evaluated at group means 


Dari tabel terlihat titik centroid untuk grup SEDIKIT adalah 0,622 pada 
function 1 dan -0,01182 pada function 2. Demikian seterusnya untuk centroid 
dua grup lainnya. 
Territorial Map 

-40 -3,0  -2,0  -1,0 ,0 
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-40 -30  -2,0  -1,0 ,0 1,0 2,0 3,0 4,0 Can. Discrim. Function 1 


Symbols used in territorial map 


Symbol Group Label 


1 0 sedikit 
2 1 sedang 
3 2 banyak 
dj Indicates a group centroid 


Untuk lebih jelas, angka-angka di atas dibuat grafik, yang disebut 
TERRITORIAL MAP, dengan function 1 adalah sumbu X, dan function 2 
adalah sumbu Y. 


Jika dilihat map di atas, terlihat tiga grup konsumen terbagi dari kiri ke 
kanan. Angka 32 yang tersebar dari kiri atas ke kiri bawah menunjukkan 
'pembagian daerah' konsumen grup SEDANG (kode 1) dengan konsumen 
grup BANYAK (kode 2). Kode 3 dan 2 adalah simbol SPSS yang tentunya 
berbeda dengan kode input yang adalah 0, 1, dan 2. Lihat tabel di bawah 
map yang menampilkan simbol dan Grup serta label setiap tipe konsumen, di 
mana simbol 3 adalah grup BANYAK dan simbol 2 adalah grup SEDANG. 


Dengan demikian, anggota grup BANYAK kebanyakan ada di bagian kiri 
sampai tengah map, sedang anggota grup SEDANG berada di tengah map. 
Demikian juga terlihat angka 21 yang ada di kanan atas sampai kanan bawah, 
yang berarti anggota grup SEDIKIT (simbol 1) kebanyakan ada di bagian 
kanan map. 
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Sedang koordinat ketiga centroid bisa dilihat pada bagian tengah map 
(perhatikan tanda panah), yang kebetulan ketiga centroid terletak berdekatan. 
Map di atas memang tidak menampilkan sebaran tiap-tiap data berdasar 
function 1 dan function 2 kecuali centroid masing-masing grup. Untuk 
melihat sebaran tiap data (kasus), pada kotak dialog CLASSIFY dan pada 
bagian PLOT, pilih COMBINED-GROUPS dan SEPARATE-GROUPS, 
selain memilih TERRITORIAL MAP yang menghasilkan map di atas. 


Interpretasi dilanjutkan dengan penjelasan STRUCTURE MATRIX sebe- 
lumnya, yang menyatakan bahwa variabel BERAT 'masuk' atau lebih dekat 
ke function 1, dengan koordinat (0,812, -0,583), sedangkan variabel USIA 
lebih dekat ke function 2, dengan koordinat (0,63, 0,776). Hal ini berarti, jika 
map di atas dibagi secara horizontal saja, dengan batas 0, maka: 


oo 5 —— 


-3 simb 3 simb2 0 simb 1 #3 


Terlihat simbol 3 (grup BANYAK) jelas berbeda dengan simbol 1 (grup 
SEDIKIT) pada Berat badannya. Karena koordinat sumbu X untuk variabel 
BERAT adalah 0,812 yang lebih dekat dengan simbol 1, karena keduanya 
positif, maka makin besar nilai variabel BERAT, makin cenderung masuk ke 
simbol 1. Atau bisa dikatakan, makin berat seseorang, makin sedikit (simbol 
1 atau kode 0) ia minum air mineral. Dan sebaliknya, makin rendah berat 
badannya, makin banyak (simbol 3 atau kode 2) konsumsi air minumnya. 


Sedang untuk variabel USIA, karena tipisnya perbedaan nilai ketiga centroid 
jika dilihat dari nilai sumbu yang berartinya, maka bisa dikatakan faktor 
USIA sebenarnya sulit untuk memilah seseorang masuk pada tipe mana. 
Walaupun demikian, jika tetap dipetakan koordinatnya, maka: 


t3 


simbol 2 (SEDANG) 
0 

simbol 1 (SEDIKIT) 
simbol 3 (BANYAK) 
-3 


Karena nilai sumbu Y untuk USIA adalah positif (0,776), yang berarti dekat 
dengan simbol 2, maka makin tinggi usia seseorang, tipe konsumsi air 
mineralnya ada pada tingkat sedang. Sedangkan makin muda usia seseorang, 
maka makin banyak ia mengonsumsi air mineral. 
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Penilaian atau interpretasi variabel yang terkait dengan grup pada dasarnya 
dilakukan dengan membagi koordinat dengan sumbu X dan sumbu Y. 
Setelah itu, jika ada dua variabel terletak pada tempat yang berlawanan 
(positif dan negatif), maka penafsiran dilakukan dengan arah berlawanan 
pula. 


KEGUNAAN TERRITORI MAP 


Kegunaan map di atas adalah untuk mengetahui sebuah data (kasus) apakah 
masuk pada grup SEDIKIT, SEDANG ataukah BANYAK. Sebagai contoh, 
untuk kasus pertama, dengan responden bernama RUSDI, terlihat nilai 
function untuknya adalah: 


e Function 1(sumbu X pada map): 1,648 (angka pada kolom DISI 1 pada 
file diskriminan tiga faktor hasil.sav 


e Function 2(sumbu Y pada map): 0,48 (angka pada kolom DIS2 1 pada 
file diskriminan tiga faktor hasil.sav 


Dengan demikian, koordinat RUSDI adalah (1,648, 0,48), yang jika diplot 
pada map di atas akan berada pada simbol 1 (grup 0). Dengan demikian, 
Rusdi termasuk konsumen dengan tipe SEDIKIT, atau dia hanya meminum 
sedikit air mineral. 


NB: hal itu bisa langsung dilihat pada kolom DIS 1 pada file diskriminan 
tiga faktor hasil.sav. 


Demikian seterusnya untuk konsumen yang lain, penempatan seorang kon- 
sumen pada salah satu grup sesuai dengan angka function 1 dan function 2. 


Jika sampel yang diambil (75 konsumen) bisa dianggap mewakili populasi, 
atau fungsi diskriminan tersebut benar-benar bisa membedakan perilaku 
ketiga kelompok, maka fungsi dan map di atas bisa digunakan untuk 
memprediksi seseorang akan masuk pada tipe yang mana. 


Sebagai contoh, jika ada konsumen bernama MULYADI, dengan usia 
20 tahun dan berat 40 kilogram, maka: 


»  Z Score 1- -7,169H0,093“20)H0,079"40)--2,149 
»  Z Score 2- -0,516#(0,129420)-(0,064"40)--0,496 


Berarti posisi MULYADI adalah (-2,149, -0,496), yang jika diplot pada map, 
akan berada pada daerah dengan simbol 3 (kode 2). Dengan demikian, 
MULYADI bisa dikategorikan orang yang BANYAK meminum air mineral. 
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KOMPOSISI ANGGOTA GRUP 


Prior Probabilities for Groups 


Ni Cases Used in Analysis 
minun Prior Unweighted Weighted 


sedikit 28 


sedang : 26 
banyak : 21 
Total 75 


Terlihat konsumen yang menjadi anggota grup SEDIKIT adalah terbanyak 
(26 orang dari total 75), dan paling sedikit adalah anggota grup BANYAK 
(21 dari total 75). Dengan demikian, kebanyakan konsumen termasuk sedikit 
dalam mengonsumsi air mineral. 


MENILAI KELAYAKAN FUNGSI DISKRIMINAN 


Classification ResultP:€ 


Predicted Group Membership Es 
MINUM Total 
Original Count .00 sediki 19 4 5 
1.00 sedang 
2.00 banyak 
.00 sediki 
1.00 sedang 
2.00 banyak 
Cross-validateda Count .00 sediki 
1.00 sedang 
2.00 banyak 
.00 sediki 21.4 1 100.0 
1.00 sedang 46.2 | 100.0 
2.00 banyak 61.9 | 100.0 
a. Cross validation is done only for those cases in the analysis. In cross validation, each 
case is classified by the functions derived from all cases other than that case. 


b. 54.796 of original grouped cases correctly classified. 


C. 49.3”o of cross-validated grouped cases correctly classified. 


Perhatikan keterangan dengan kode b pada tabel di atas, yang menyatakan 
bahwa 54,7”o dari data telah terklasifikasi dengan benar. Hal ini berarti 
54,7Yo dari 75 data yang diolah telah dimasukkan pada grup yang sesuai 
dengan data semula. Sebagai contoh, jika pada baris 1 konsumen bernama 
RUSDI dikategorikan masuk ke grup SEDIKIT, maka setelah proses 
pembuatan fungsi diskriminan dan map teritori, posisi RUSDI tetap 
dikategori minum SEDIKIT. 
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Jika dilihat dari validasi silang (cross validated), yang ada pada kode c, maka 
angka tersebut -yang tentunya lebih kecil dari 54,7”o- adalah 49,3”o. Semakin 
tinggi nilai validasi, termasuk cross-validated groups tentu semakin bagus, 
karena semakin tepat fungsi diskriminan membedakan ketiga grup konsu- 
men. Namun demikian, karena kedua angka tersebut bisa dianggap ada di 
sekitar 50Yo, maka fungsi diskriminan yang telah dibentuk, juga map teritori 
yang telah dibuat, sudah layak untuk membedakan ketiga grup konsumen 
tersebut. 


KESIMPULAN 


Dari berbagai tabel output dan analisis di atas, kesimpulan yang didapat 
dengan mengacu pada empat pertanyaan pada awal kasus: 


l. ADA perbedaan yang jelas antara konsumen yang mengonsumsi 
SEDIKIT air mineral, dengan mereka yang termasuk SEDANG atau 
BANYAK mengonsunssi air mineral. 


2. Variabel yang membedakan perilaku mengonsumsi air mineral adalah 
USIA seseorang dan BERAT badannya. 


3. Ada dua fungsi diskriminan yang terbentuk, yakni: 
Z Score 1- -7,169-(0,093 USLA)-(0,079 BERAT) 
Z Score 2- -0,516-(0,129 USIA)-(0,064 BERAT) 


4. Karena hasil validasi mendekati angka 5096, maka fungsi diskriminan 
yang terbentuk dianggap tepat untuk menggolongkan seorang konsumen 
berdasar usia dan berat badannya, ke dalam grup SEDIKIT, SEDANG 
ataukah BANYAK. 


Pada kasus di mana ada dua (7wo-Group Diseriminani) atau tiga grup 
(termasuk Multiple DiscriminanH, pembuatan grafik atau map masi 

dimungkinkan untuk menggolongkan kasus tertentu hingga terletak pada 
grup tertentu. Namun, jika sudah ada empat grup atau lebih, pembuatan map 
menjadi kompleks, karena melibatkan banyak dimensi. Walaupun demikian, 
tahapan proses dan interpretasi output tetap berdasar pada berbagai 


penjelasan yang telah diuraikan di atas. 


5 A4 Logistic Kegression 


Pada dasarnya logistic regression (regresi logistik) sama dengan analisis 
diskriminan, perbedaan ada pada jenis data dari variabel dependen. Jika pada 
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analisis diskriminan variabel dependen adalah data rasio, maka pada regresi 
logistik variabel dependen adalah data nominal. Data nominal di sini lebih 
khusus adalah data binary. 


Dengan demikian, tujuan regresi logistik adalah pembuatan sebuah model 
regresi untuk memprediksi besar variabel dependen yang berupa sebuah 
variabel binary menggunakan data variabel independen yang sudah diketahui 
besarnya. 


Catatan 

Variabel Binary adalah data jenis nominal dengan dua kriteria saja, seperti: 
1 — Membeli 

0 — Tidak membeli 

Atau contoh yang lainnya, seperti gagal-sukses, risiko-tidak risiko. 


Data yang digunakan pada regresi logistik adalah data kuantitatif. Jika data 
adalah kualitatif (pada umumnya adalah data jenis kategori atau nominal), 
maka data tersebut akan diperlakukan sebagai binary variable. 


Kasus berikut akan menjelaskan penggunaan regresi logistik. 


KASUS 


Manajer PT DUTA MAKMUR ingin mengetahui apakah perilaku membeli 
atau tidak membeli produk perusahaan ditentukan oleh kegiatan berikut ini 
(sebagai variabel bebas): 


o Iklan di koran (variabel: iklan koran) 
o Iklan di Radio (iklan radio) 
o Jumlah Outlet penjualan di seluruh daerah (outlet) 


o Jumlah salesman yang ada (salesman) 


Pengolahan data dengan SPSS: 
e Buka file regresi binary. 


e Menu Analyze YRegression Binary Logistic.... Tampak di layar: 
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— Bependent: 


Ga dserah | SJ 01 
& iwan koran Block Tori Save. 
$ manca ea 
£ ottet 
$ saeom Covariates: 
£ ve KE 
» 
Method: Enter ” 
Selection Variable: 
edi | 


| reset || cancer || He 
Gambar 5.16. Kotak Dialog Logistics Regression 
Pengisian: 


e  Dependent atau variabel tergantung. Pilih variabel beli. 


Variabel 'beli' yang berupa sebuah kategori dengan tanda 1 untuk 'membeli' 
dan 0 untuk 'tidak membeli'. 


e  Covariates. Pilih variabel iklan koran, iklan radio, outlet dan 
salesman. 


e Klik tombol OPTIONS kemudian aktifkan pilihan Homer- 
Lemeshow goodness of fit dan Iteration history. 


Pilihan iteration history akan mencatat perubahan nilai -2Log Likelihood 


(-2LL) yang menentukan kelayakan model regresi. 


Abaikan bagian yang lain, dan ketik CONTINUE untuk kembali ke 
kotak dialog utama. 


e Method. Pilih Enter. 
ABAIKAN BAGIAN YANG LAIN, lalu tekan OK untuk proses data. 


Output disimpan dengan nama regresi binaryi1. 


Output dan Analisis 
Menilai Kelayakan Model Regresi 


Hosmer and Lemeshow Test 


ON MANAGEMEN MANA 


Perhatikan output dari Hosmer and Lemeshow dengan urutan interpretasi. 
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Hipotesis 


Ho: Tidak ada perbedaan yang nyata antara klasifikasi yang diprediksi 
dengan klasifikasi yang diamati. 


Hi: Ada perbedaan yang nyata antara klasifikasi yang diprediksi dengan 
klasifikasi yang diamati. 


Dasar Pengambilan Keputusan 


Perhatikan nilai goodness of fit test yang diukur dengan nilai Chi-Sguare 
pada bagian bawah uji Hosmer and Lemeshow. 


OI Jika probabilitas » 0,05 Ho diterima. 
U Jika probabilitas « 0,05 Ho ditolak. 
Keputusan 


Karena angka probabilitas adalah 0,7402 yang adalah » 0,05 maka Ho 
diterima. Hal ini berarti model regresi binary layak dipakai untuk analisis 
selanjutnya, karena tidak ada perbedaan yang nyata antara klasifikasi 
yang diprediksi dengan klasifikasi yang diamati. 


Menilai Keseluruhan Model (Overall Model Fit) 
Output pada Beginning Block (Block — 0). 


Block 0: Beginning Block 


Iteration History? 5: 


-2 Log 


likelihood Constant 


eration 
Step O 400 
405 
405 


a. Constant is included in the model. 
b. Initial -2 Log Likelihood: 40,381 


c. Estimation terminated at iteration 
number 3 because parameter estimates 
changed by less than ,001. 


Output pada Block I. 
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Block 1: Method - Enter 


Iteration History? 5.9 


Coefficients 
-2 Lag 
eration likelihood Constant | iklan koran | iklan radio outlet salesman 


a. Method: Enter 
b. Constant is included in the model 
C. Initial -2 Log Likelihood: 40,381 


FA Estmatian terminated at iteration number 4 because parameter estimates changed by less 
an, 


Omnibus Tests of Model Coefficients 


lonemare ar 
nona 1 Step 3 578 
Block 8.578 
Model 8.578 


Model Summary 


oo ugtea | ox 8. nellR | Nagetkerke R 
ood Sguare Sguare 


hn m0 2 


a. Estimation terminated at iteration number 4 
because parameter estimates changed by less than 


Perhatikan angka - 2 Log Likelihood, di mana pada awal (Block Number — 0) 
angka - 2LL adalah 40,381, sedangkan pada Block Number — 1 angka - 2LL 
turun menjadi 31,802. Penurunan ini, di mana Likelihood pada regresi binari 
mirip dengan pengertian 'sum of sgaured error' pada model regresi, me- 
nunjukkan model regresi yang lebih baik. 


Menguji Koefisien Regresi 


Variables in the Eguation 


iklan koran 
iklan radio 


outlet 
salesman 
Constant 
a. Variablets) entered on step 1: iklan koran, iklan radio, outlet, salesman. 


Dengan uji t yang terlihat pada bagian akhir output, terlihat bahwa hanya 
variabel iklan koran yang signifikan secara statistik, terlihat dari angka Sig. 
pada variabel iklan koran (0,0230) yang di bawah 0,05. Sedangkan variabel 
lain mempunyai angka probabilitas (signifikansi) di atas 0,05. 


Untuk itu, model regresi akan diulang lagi, dengan sekarang hanya mema- 
sukkan variabel iklan ko sebagai variabel independen. 
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MODEL REGRESI BINARY KE-2 
Proses ulangan: 
e Buka file regresi binary. 
e Menu Analyze 5 Regression 5 Binary logistic... 
Klik tombol reset untuk menghapus semua input terdahulu. 


Kemudian lakukan pengisian pada kotak dialog Binary Logistic. 


BB) Logistic Regression (Sai 


Dependent: 
(Ga daerah » | 


iktan. koran Block 10f1 : 


Method (Eror j 


(Czesa Joe JL too) 


Gambar 5.17. Kotak Dialog Logistics Regression 
Pengisian: 
o  Dependent. Pilih variabel beli. 


o  Covariates. Pilih variabel iklan koran. 


Sekarang variabel iklan radio, salesman dan outlet tidak dimasukkan lagi. 


o Klik tombol OPTIONS kemudian aktifkan pilihan Homer- 
Lemeshow goodness of fit dan Iteration history. 


Abaikan bagian yang lain, dan ketik CONTINUE untuk kembali ke 
kotak dialog utama. 


o Method. Pilih Enter. 
Abaikan bagian yang lain dan tekan OK untuk proses data. 


Output disimpan dengan nama regresi binary2. 


Output dan Analisis 
Menilai Kelayakan Model Regresi 


Hosmer and Lemeshow Test 


Ba 


MEN Ba BE 
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Perhatikan nilai goddness of fit test yang diukur dengan nilai Chi-Sguare 
pada bagian bawah uji Hosmer and Lemeshow. Terlihat angka probabilitas 
0,418 yang adalah » 0,05. Hal ini berarti model regresi binary layak dipakai 
untuk analisis selanjutnya, karena tidak ada perbedaan yang nyata antara 
klasifikasi yang diprediksi dengan klasifikasi yang diamati. 


Classification Table? 


Predicted 


rilaku beli 
membeli Membeli 


Observed 
Step 1 perilaku beli — Tidak membeli 
Membeli 
Overall Percentage 


a. The cutvalue is ,500 


Selain itu, jika dilihat dari OVERALL CLASSIFICATION TABLE, terlihat 
peningkatan overall hit ratio, yaitu dari 70Yo pada model regresi 1 (lihat 
output regresi binaryl) ke 73,36 pada model regresi 2. 


Menilai Keseluruhan Model (Overall Model Fit) 
Blok awal 5 Block number — 0. 


Block 0: Beginning Block 


Iteration History? 5: 


erafjon likelihood Constant 


Step 0 40.381 400 
40.381 405 
40.381 405 
a. Constant is included in the model. 
b. Initial -2 Log Likelihood: 40,381 


c. Estimation terminated at iteration 
number 3 because parameter estimates 
changed by less than ,001 


Block Number — 1. 


Block 1: Method - Enter 


Iteration History? 5:2. 


eration likelihood Constant | iklan koran 


a. Method: Enter 


b. Constant is included in the model 
C. Initial -2 Log Likelihood: 40,381 


d. Estimation terminated at iteration number 4 because 
parameter estimates changed by less than ,001. 
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Perhatikan angka - 2 Log Likelihood, di mana pada awal (Block Number — 0) 
angka - 2LL adalah 40,381, sedangkan pada Block Number — 1 angka - 2LL 
turun menjadi 33,013. Penurunan ini menunjukkan model regresi yang lebih 
baik. 


Menguji Koefisien Regresi 


Variables in the Eguation 


| 5 | se |waa | oa | sa | egg | 


Step132 iklan koran -186 077 5.772 1 .016 830 
Constant 6.030 2.400 6.312 1 012 | 415.837 


a. Variablets) entered on step 1: iklan koran. 


e Uji t untuk menguji signifikansi konstanta dan setiap variabel inde- 
penden. 


Hipotesis 

H, — Koefisien regresi tidak signifikan. 

H, — Koefisin regresi signifikan. 
Pengambilan Keputusan 

Berdasarkan Probabilitas. 

o Jika probabilitas » 0,05 maka H, diterima. 
o Jika probabilitas « 0,05 maka H, ditolak. 
Keputusan 

Terlihat bahwa pada kolom Sig/significance: 


Dengan uji t yang terlihat pada bagian akhir output, konstanta dan 
variabel iklan koran adalah signifikan secara statistik (lihat angka Sig. 
pada konstanta yang 0,012 dan variabel iklan koran yang 0,016 di mana 
keduanya di bawah 0,05). Dengan demikian, sekarang model regresi 
layak digunakan untuk memprediksi variabel beli. 


Penafsiran dan Prediksi 


e Persamaan regresi binary model ke-2 (lihat kolom B pada bagian 
VARIABLES IN THE FOUATION di bagian akhir output). 


beli — 6,0298 - 0,1860 iklan ko 
Penafsiran: 


Cara menafsir regresi dengan variabel dependen binary adalah dengan 
pendekatan probabilitas. Dan karena tidak ada probabilitas “negatif” atau 
“lebih dari satu', maka jika: 
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o Angka negatif, dianggap probabilitas 0. 
o Angka positif lebih dari satu, dianggap probabilitas 1 


o Angka positif di antara 0 sampai 1, probabilitas sesuai angka 
yang tertera. 


» Konstanta sebesar 6,0298 menyatakan bahwa jika tidak ada iklan di 


koran, konsumen tetap membeli Produk Roti DUTA MAKMUR. 
NB: Di sini angka lebih dari satu, maka dianggap probabilitas — 1. 


Koefisien sebesar — 0,1860 menyatakan bahwa setiap perubahan 
Rp.1 juta Rupiah (satuan iklan ko dalam juta rupiah) dalam iklan 
produk di koran, maka kemungkinan konsumen untuk membeli roti 
malah berkurang (karena tanda -) sebesar 18,60Y9! 


Contoh 


Jika bulan Juni 2000 perusahaan menganggarkan iklan di radio 
sebesar Rp.30 juta, maka: 


beli — 6,0298 — | 0,1860 (30) | - 0,4498 


Arti: probabilitas konsumen membeli roti dengan iklan di radio 
Rp.30 juta sebulan adalah 44,9896. Karena tanda negatif pada 
koefisien, maka semakin tinggi anggaran iklan di radio, semakin 
turun probabilitas konsumen untuk membeli roti. 


Tafsiran seperti ini sebenarnya secara logika agak “aneh”, karena 
seharusnya semakin banyak diiklankan, harusnya penjualan roti 
semakin bertambah, atau probabilitas konsumen membeli roti se- 
makin bertambah. 


Dengan output seperti itu, sebenarnya perusahaan malah tidak perlu 
melakukan kegiatan periklanan, karena tanpa iklan pun roti tetap 
terjual, dan membuat iklan malah ada kemungkinan penjualan 
menurun! 


